پیکره انگلیسی آمریکایی معاصر
پیکرهٔ انگلیسی آمریکایی معاصر (کوکا) COCA (به انگلیسی: Corpus of Contemporary American English) وبگاهی است رایگان با قابلیت جستجوی کلمه، که در نوع خود بزرگترین است، شامل حدود ۴۵۰ میلیون واژهٔ انگلیسی (انگلیسی آمریکایی معاصر). این مجموعه تنها پیکرهٔ در دسترس عمومی است. این مجموعه زیرنظر مارک دِیویس، استاد زبانشناسی پیکرهای در دانشگاه بریگم یانگ طراحی و ساخته شدهاست.
«کوکا» از بیش از ۴۵۰ میلیون واژه، درمجموع شامل ۱۶۰٬۰۰۰ متن تشکیل شدهاست. بازهٔ زمانیِ متنهای پیکره، دربرگیرندهٔ سالهای ۱۹۹۰ تا ۲۰۱۵ است. از متنهای هر سال ۲۰ میلیون واژه انتخاب شدهاست. متنهای هر سال، پنج ژانر (مقولهٔ اصلیِ موضوعی) را دربرمیگیرد: زبان گفتاری، ادبیات داستانی، مجلههای عمومی، روزنامهها، و نشریات دانشگاهی/ آکادمیک.
آخرین نسخهٔ این پیکره در دسامبر ۲۰۱۵ عرضه شد. ماهانه دهها هزار نفر از وبگاه «کوکا» بازدید میکنند. ظاهراً این وبگاه پربازدیدترین منبعِ رایگانِ برخط با این موضوع است.
منابع مورداستفاده
برای تهیهٔ این پیکره از منابع گوناگونِ زیر استفاده شدهاست:
- گفتاری (۸۵ میلیون واژه): صورتِ نوشتاریِ مکالمههای نانوشته، برگرفته از ۱۵۰ برنامهٔ تلویزیونی و رادیوییِ گوناگون؛
- ادبیات داستانی (۸۱ میلیون واژه): داستان کوتاه و نمایشنامه، فصل نخست کتابهای گوناگون در این موضوع (منتشرشده از سال ۱۹۹۰ و پس از آن)، متنِ فیلمها/ فیلمنامهها؛
- مجلات عمومی (۸۶ میلیون واژه): حدود ۱۰۰ مجلهٔ گوناگون با موضوعاتِ مختلف، ازجمله خبری، تندرستی، خانوادگی، باغبانی، بانوان، مالی، مذهبی، و ورزشی؛
- روزنامهها (۸۱ میلیون واژه): ۱۰ روزنامه از سراسرِ ایالات متحده. متنهای بخشهای گوناگونِ روزنامهها، شامل اخبار محلی، دیدگاهها، ورزش، و بخش تجاری انتخاب شدهاند؛
- نشریات دانشگاهی/ آکادمیک (۸۱ میلیون): حدود ۱۰۰ نشریهٔ علمی-پژوهشی از همهٔ موضوعات ردهبندیشده در کتابخانهٔ ملی کنگرهٔ آمریکا انتخاب شدهاست.
پیوند به بیرون
منابع
- کتابخانهٔ دانشگاه آریزونا (معرفی «کوکا») بایگانیشده در ۲۴ آوریل ۲۰۱۴ توسط Wayback Machine
- وبگاه هلسینکی (معرفی «کوکا»)