|
|
|||||
Технологии
Израильские исследователи разработали несложный компьютерный алгоритм,
который позволяет по лексике и синтаксису текста установить пол его
автора, а также определить жанр, в котором он пишет. Вероятность
правильного распознавания достигает 80%, причем даже при анализе
научно-фантастической литературы.
Компьютерный алгоритм подтверждает и без того хорошо известный стереотип: каждый пол язык использует немного по-своему. Говоря по-простому, мужчинам более свойственно описывать сами объекты, а женщинам - взаимоотношения. По словам автора программы Моше Коппеля (Moshe Koppel) из университета Бар-Илам в Рамат Гане (Израиль), писательницы чаще употребляют личные местоимения. Писатели-мужчины в большей степени предпочитают использовать указательные местоимения и количественные числительные, что говорит об их склонности к обобщению, в то время как женщины любят персонифицировать. Г-н Коппель и его сотрудники первоначально "обучили" программу на нескольких тестовых примерах, позволивших определить характерные особенности женского и мужского стиля письма, причем как в обычной литературе, так и в фантастике. После этого программа принялась распознавать пол авторов 566 англоязычных работ самых различных жанров - от путеводителя по Праге до романа "Одержимость" Антонии Сьюзен Байет. Определить пол последней даже компьютеру оказалось не под силу; программа не распознала пол и автора романа "Остаток дня" Кацуо Исигуро, японца по происхождению, англичанина по языку и гражданству. Удивительно, но женский и мужской стили письма различаются так же сильно, как обычная проза и фантастика. Интересно также, что программа может отличить эти жанры друг от друга с еще большей вероятностью – в 98% - чем определить пол авторов. Большинство исследованных работ были опубликованы после 1975 года. Теперь окрыленные успехом израильтяне собираются обратиться к более ранним литературным произведениям и выяснить, в частности, удалось ли английской писательнице Джордж Элиот скрыть свою женскую сущность под мужским псевдонимом, а также определить, прослеживаются или нет аналогичные зависимости в других языках.
Рекомендуем
Обсуждение новости
|
|