Компьютер научили отличать вымысел от правды

Ученые разработали алгоритм, который позволяет компьютеру отличать новостные сообщения от художественных текстов, а именно рассказов. Машина определяет, к какому типу относится текст, анализируя частоту использования слов и оценивая, насколько часто попадаются пары тех или иных слов.

Ученые разработали алгоритм, который позволяет компьютеру отличать новостные сообщения от художественных текстов, а именно рассказов. Статья исследователей пока не принята к публикации в рецензируемый научный журнал, но ее препринт доступен на сайте arXiv.org.

Алгоритм, придуманный авторами этой научной работы, анализирует, сколько раз любое слово из текста встречается вместе с другими словами в рассказах и новостных сообщениях. Полученные данные впоследствии сравнивали.

Оказалось, что для двух данных типов текстов этот показатель заметно отличается. Исследователи проверили созданную ими методику при помощи 400 новостных заметок, случайным образом выбранных с новостного сайта National Public Radio, и 400 случайных рассказов из базы электронной библиотеки проекта «Гутенберг». Чтобы исключить влияние исторических особенностей языка, авторы выбирали для анализа произведения писателей XX века.

Для новостных заметок точность угадывания составила 69,1 процента с погрешностью 1,22 процента, а для рассказов — 73,8 процента с погрешностью 5,15 процента.

Недавно другой коллектив ученых представил еще одну работу, в которой были продемонстрированы возможности использования компьютера для анализа текстов. Исследователи разработали алгоритм, при помощи которого компьютер смог расшифровать один из мертвых языков семитской группы за несколько часов.

Компьютер научили распознавать записи в Твиттере от нетрезвых пользователей
Работа была проделана огромная, анализу подверглись более десяти тысяч твитов на предмет использования определённых слов, которые характерны для изрядно выпивших людей.

Ученые создали программу, способную отличать симулянтов от больных
Ученые создали программу, способную отличать симулянтов от больных Американские и канадские исследователи разработали эвристическую компьютерную программу, способную различать реальную и притворную боль.

Самураи и кадзи
И плохому кузнецу случается выковать хороший меч.

Анжелика Варум научилась жить вдали от дочери
Анжелика Варум живет насыщенной жизнью: концерты, гастроли по городлам и странам, запись новых альбомов. Вторым домом для певицы стал Майами, где круглый год тепло и светит солнце.

Кадыров рассказал об отличии Асада от Каддафи
Исполняющий обязанности главы Чечни Рамзан Кадыров заявил в интервью РИА «Новости», что президент Сирии Башар Асад, хотя и производит впечатление интеллигента и дипломата, в отличие от бывшего ливийского лидера Муаммара…


  • Рассказов,
  • Текст,
  • Процент,
  • Алгоритм,
  • Помощь,
  • Заметка
Комментировать публикацию через Постсовет:
Комментарии (0) RSS свернуть / развернуть

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.


Комментировать публикацию через Вконтакте: