Автоматизированная журналистика в современном глобальном мире

Заказать уникальную курсовую работу
Тип работы: Курсовая работа
Предмет: Теория и практика СМИ
  • 30 30 страниц
  • 8 + 8 источников
  • Добавлена 14.01.2015
1 496 руб.
  • Содержание
  • Часть работы
  • Список литературы
  • Вопросы/Ответы
Введение 2
1. WEB2.0 – рабочая среда автоматизированной журналистики 4
1.2 Принцип действия роботов - генераторов контента 12
2. Обзор существующих программных решений 21
2.1 Magic article rewriter 23
2.2. Power Article Rewriter 24
2.3 Article Rewrite Worker 25
2.4 WordFlood 2.0 26
2.5 Другие автоматические генераторы веб-контента 27
Заключение. 28
Список литературы. 30

Фрагмент для ознакомления

Следует отметить, что такой подход трудозатратен и на него может согласиться не каждый пользователь. Генераторы-полуавтоматы, безусловно, упрощают работу веб-оптимизаторов, но человеческий фактор в процессе генерации остается очень высоким.Второй подход дает более удачные результаты с точки зрения качества порожденного текста. Но по-настоящему хорошие результаты описанными программами достигаются в случае, если пользователь заменяет целые куски текста, которые генератор использует в перестановках. И обратно, чем больше автоматическая часть, тем менее похожими на написанный человеком текст получаются итоговые статьи.Результаты анализа текста напрямую влияют на результат порождения: чемкачественнее произведено распознавание текста, тем более хороших результатов можно ждать от генератора. Но задача распознавания машиной текста на естественном языке является сложной задачей, решение которой приблизит человека к созданию искусственного интеллекта. Поэтому описанные полуавтоматы, прибегающие к помощи человека, справляются с задачей порождения статей лучше, чем полностью автоматические инструменты.Рассмотрим подробнее некоторых представителей отрасли "автоматизированной журналистики".2.1 MagicarticlerewriterОдним из наиболее известных инструментов контент-менеджеров, специалистов поуправлению содержанием веб-сайта, является коммерческий продукт MagicArticleRewriter, выпущенный на рынок в 2009 году. На данный момент версию 1.8приложения, выпущенную в феврале 2010 года, можно приобрести за 77 долларов. Всвободном доступе его нет, поэтому посмотреть на работу приложения непосредственноне представляется возможным, но по описанию продукта и отзывам пользователей можносделать некоторые выводы об используемом в приложении подходе к генерации текста.С помощью MagicArticleRewriter можно породить множество текстов из некоторойзаданной статьи. Это происходит путем замены отдельных слов синонимами и целыхпредложений их семантическими эквивалентами. Подбор эквивалентов для слов ипредложений осуществляется пользователем приложения. Пользователь может выбратьодин или несколько синонимов для слов текста из встроенной базы данных либо ввестисемантический эквивалент слова или предложения вручную. Приложение работает с базойданных, содержащей около 30 000 слов вместе с синонимами. (Примечание – По даннымоксфордского университета в современном английском языке содержится свыше 170 000слов, а также порядка 50 000 устаревших слов).После проделанной пользователем работы получается прототип текста сдобавленными вариантами слов и предложений. На основе этого прототипа MagicArticleRewriter способен породить случайный экземпляр статьи либо указанное пользователемчисло новых статей, каждая из которых будет сохранена в отдельный файл на жесткомдиске.Программа имеет удобный пользовательский интерфейс и массу положительныхотзывов. Но следует отметить, что имеются и негативные отзывы, называющие функциюгенерации множества текстов «сплошным мошенничеством». Пользователи отмечаютнизкое качество порожденного текста, некорректную морфологическую обработкуТакже к слабым местам данного программного продукта стоит отнести функцию случайной генерации статей, не учитывающую близость порожденных текстов между собой.2.2. PowerArticleRewriterЕще одним продуктом, порождающим новые статьи из старого контента, является PowerArticleRewriter. Он появился в 2008 году.Функциональность этого продукта очень похожа на функциональность MagicArticleRewriter. Для обработки приложением оригинальная статья может быть введена вспециальное текстовое поле либо загружена из файла. Действия пользователя в PowerArticleRewriter аналогичны его действиям в MagicArticleRewriter: после загрузки текстав систему пользователь создает множества семантических эквивалентов для слов изтекста. Для этого используются синонимы слов из встроенного тезауруса либоэквиваленты слов, предложенные самим пользователем. К тому же, существует функция«вложенных вариаций», то есть пользователь может указать варианты замены не толькодля отдельных предложений из текста, но и для уже предложенных семантическихэквивалентов предложений. В результате описанной обработки текста получаетсянекоторая структура; опираясь на нее, программа порождает новый текст, который можноотредактировать и сохранить. Также в приложении имеется возможность генерациипроизвольного числа уникальных текстов с последующим сохранением на жесткий дисккомпьютера.Этот продукт, как и предыдущий, является коммерческим, его пробная версиядоступна в течение пятнадцати дней, что и позволило непосредственно ознакомиться с егоработой. Стоимость лицензионной версии PowerArticleRewriter составляет 97 долларов.2.3 ArticleRewriteWorker«ArticleRewriteWorker – инструмент для генерации статей высокого качества,большинство из которых могут быть проиндексированы поисковыми роботамиGoogle/YAHOO/MSN, несмотря на небольшие грамматические ошибки, появляющиесяпри генерации», - с официального сайта ArticleRewriteWorker.Работа приложения направлена на автоматическую генерацию указанного числа (от1 до 1000) текстов, лексически отличных от исходного с заданным значением степениискаженности (от «очень низкого» до «наивысшего»). Приложение имеет встроенныйтезаурус размером 35 500 слов.Приложение имеет два режима работы: «автоматический» (Примечание – ФункцияAuto) и «ручной» (Примечание – Функция Manual). В «автоматическом» режиме работыгенерация осуществляется путем замены слова или словосочетания на любой из егосинонимов, имеющихся во встроенном тезаурусе. В «ручном» режиме работы передэтапом генерации пользователю предлагается выбрать семантические эквиваленты дляслов текста из тезауруса (при наличии слова в базе данных) или предложить свой вариант.То есть, функция Manual позволяет отобрать синонимы слова, соответствующиеконтексту. Такое сокращение множества синонимов приводит к повышению степенисемантического соответствия порожденного текста и оригинальной статьи.После процедуры генерации пользователь может вручную отредактировать каждыйиз порожденных текстов для улучшения его качества, а именно: произвести заменынекорректно употребленных слов, расставить знаки препинания и исправитьграмматические ошибки.В приложении имеется возможность загрузки статьи из файла, а также сохранениялюбого порожденного текста на жестком диске компьютера. Среди прочих ArticleRewriteWorker отличается красочным пользовательским интерфейсом.Последняя версия продукта вышла в феврале 2011 года. Продукт является платным,его можно приобрести за 50 долларов, в свободном распространении имеется егоурезанный вариант.2.4 WordFlood 2.0WordFlood 2.0 – это настольное приложение, представленное на официальномсайте продукта, как «помощник писателей и интернет-маркетологов при выборе лучшихслов и фраз для упрощения процессов создания и редактирования текстов». WordFlood неявляется генератором контента в прямом смысле этого слова, но, по факту, решает ту жесамую задачу, что и вышеописанные автоматические генераторы, а именно: создает новыеоригинальные статьи для продвижения веб-сайтов. И, судя по работе приложения, подходк созданию новых текстов примерно такой же, как и в продуктах, ориентированных наавтоматическую генерацию. То есть, пользователю предлагается выбрать новые,подходящие по контексту варианты слов и предложений из некоторого тезауруса либоввести собственные. Плюсом системы является большой объем лексической базы данныхс синонимами - около 140 000 слов и фраз английского языка. К минусам системыотносится создание только одной статьи на выходе.Пользовательский интерфейс приложения делится на две части: текстовое поле, куданепосредственно вводится исходный текст, либо загружается из файла; и поле синонимов, в котором отображаются слова с предложенными вариантами синонимов. После выборапользователем подходящих замен для слов изменение текста также отображается втекстовом поле. Особенностью интерфейса, положительно влияющей на качествопорожденной статьи, создатели приложения называют поле синонимов. Оно даетвозможность единовременного обзора нескольких подряд идущих слов и варианты ихзамены. Эта особенность, по утверждению создателей приложения, позволяет непотеряться в контексте, что в свою очередь увеличивает скорость работы пользователя стекстом.После вышеописанной полуавтоматической обработки текста пользователемполучается одна новая статья, которую можно сохранить для дальнейшего использования.Приложение WordFlood 2.0 распространяется с 2008 года, до сих поросуществляется его поддержка и приобрести продукт можно за 67 долларов.Испытательная версия программы работает в течение двух недель с момента установки,это позволило наряду с изучением описания продукта WordFlood 2.0 наглядноознакомиться с его функциональностью.2.5 Другие автоматические генераторы веб-контентаОписанные в данной главе генераторы статей не единственные, можно назвать идругие похожие продукты, например:- Quick Article Spinner;- Instant Article Wizard;- Article Queen;- ADSpinner;- EZ-ReWriter Software имногиедругие.Большинство из них является платными коробочными продуктами, но такжевстречаются и бесплатные приложения и веб-сайты.ЗаключениеПодводя итог, скажем, что перспективы перед гуманитарными исследованиями от использования автоматизированных систем тематической индексацииоткрываются необъятные. Можно предположить, что в перспективе, реализация идеи тематической индексации приведёт к специализации интернет-поисковиков. Она также позволит поисковым программам операционных систем автоматически создавать рубрицированный каталог всех электронных текстов на персональных компьютерах. Тематический поисковик сможет индексировать файлы и сайты по ограниченному набору тематик из какой-либо узкой предметной области, скажем из истории России, но зато предельно корректно.В интеллектуальных поисковиках будущего можно будет исключать из результатов поиска не просто нежелательные слова (их всех не предусмотришь), но и нежелательные тематики; регулировать ранжирование результатов поиска по степени доминирования тематики в текстах или в их фрагментах. Тривиальный поиск по словам, конечно, тоже останется, но он будет уже иметь вторичный характер.Априорные величины для тематической индексации текстов по формуле Байеса могут сформировать только гуманитарии – специалисты в дискурсивных особенностях тех областей знаний, для которых происходит обработка текстов и документов. Речь идёт в частности о составлении дисциплинарных, субдисциплинарных и междисциплинарных идеографических словарей нового типа. В таких словарях по каждой предметно-тематической рубрике будет содержаться список и объяснение всех контекстно-инвариантных употреблений определённых словоформ, понятий или идиом. Для обозначения подобных «сборников контекстов» (с перечислением, но без анализа) в корпусной лингвистике используется термин «конкорданс». Однако существующие конкордансы носят исключительно языковедческо-справочный характер. Здесь же имеется ввиду создание неких предметных баз знаний.Эвристические возможности фильтрации, сортировки и компоновки информации в такой базе знаний как раз и откроет новые горизонты гуманитаристики. Они станут действенным поводом для новых форм рефлексии гуманитариев над методами и целями своих исследований, над своими языками и текстами, и предоставят широкой аудитории новые поводы заинтересоваться этими текстами. Будь то классические философские трактаты, электронные архивы сообщений СМИ за прошлые годы, базы данных с отчётной отраслевой документацией, протоколы заседаний или любые иные корпуса текстов. У гуманитариев помимо задачи «выписывать из разных книжек в одну тетрадку», появятся новые более творческие задачи, связанные с поиском способов автоматизации конспектирования, реферирования и аннотирования текстов. Автоматизация настраиваемых субдисциплинарных рубрикаций, ранжирования и комбинаторики текстов создаёт новые стимулы их прочтения, новые направления интересов, новые способы интерпретации описанных в текстах событий и явлений. Соответственно, всё это может открыть и новые перспективы гуманитарных наук XXI века.Список литературыБиргер П. «Я не верю в роботов-журналистов, но знаю, что часть журналистcкой работы могут выполнять роботы». Основатель стартапаNarrativeSciencе Стюарт Френкель рассказал Slon.ru о том, как компьютеры могут заменить работников СМИ//Slon.- Режим доступа: http://slon.ru/Соколов А.В. Метатеория социальной коммуникации. - СПб., 2002.- 470 с.Ландэ Д.В. Поиск знаний в Internet.- Киев, 2010.- 320 с.Маркова, М.В. Порождение уникального WEB-контента на основе аннотированного текста / Материалы XLIX Международной Студенческой Конференции «Студент и научно-технический прогресс»: Информационные технологии (16-20 апреля 2011 г.).Новосиб. гос. ун-т. Новосибирск, 2011. – С. 209.Официальный информационный ресурс продукта PowerArticleRewriter[Электронный ресурс]. – Режим доступа: http://powerarticlerewriter.com/, свободный.Официальный ресурс продукта ArticleRewriteWorker / [Электронный ресурс]. –Режим доступа: http://www.articlerewriteworker.com/, свободный.Официальный ресурс проекта WordFlood / [Электронный ресурс]. – Режим доступа:http://www.wordflood.com/, свободный.Бочаров А.В. Автоматизация обработки неструктурированной текстовой информации и перспективы гуманитарных наук в XXI веке//Человек-текст-эпоха. -Томск: Изд-во ТГУ, 2011.-Вып. 4.- С. 15-37.

1. Биргер П. «Я не верю в роботов-журналистов, но знаю, что часть журналистcкой работы могут выполнять роботы». Основатель стартапа Narrative Sciencе Стюарт Френкель рассказал Slon.ru о том, как компьютеры могут заменить работников СМИ//Slon.- Режим доступа: http://slon.ru/
2. Соколов А.В. Метатеория социальной коммуникации. - СПб., 2002.- 470 с.
3. Ландэ Д.В. Поиск знаний в Internet.- Киев, 2010.- 320 с.
4. Маркова, М.В. Порождение уникального WEB-контента на основе аннотированного текста / Материалы XLIX Международной Студенческой Конференции «Студент и научно-технический прогресс»: Информационные технологии (16-20 апреля 2011 г.).Новосиб. гос. ун-т. Новосибирск, 2011. – С. 209.
5. Официальный информационный ресурс продукта Power Article Rewriter [Электронный ресурс]. – Режим доступа: http://powerarticlerewriter.com/, свободный.
6. Официальный ресурс продукта Article Rewrite Worker / [Электронный ресурс]. –Режим доступа: http://www.articlerewriteworker.com/, свободный.
7. Официальный ресурс проекта WordFlood / [Электронный ресурс]. – Режим доступа:http://www.wordflood.com/, свободный.
8. Бочаров А.В. Автоматизация обработки неструктурированной текстовой информации и перспективы гуманитарных наук в XXI веке//Человек-текст-эпоха. -Томск: Изд-во ТГУ, 2011.- Вып. 4.- С. 15-37.

Вопрос-ответ:

Какую роль играет автоматизированная журналистика в современном глобальном мире?

Автоматизированная журналистика играет важную роль в современном глобальном мире. Она позволяет быстро и эффективно генерировать контент, освобождая журналистов от рутинной работы. Это позволяет расширить область освещения новостей и обеспечить большую доступность информации для пользователей.

Какие принципы действия у роботов-генераторов контента?

Роботы-генераторы контента работают на основе алгоритмов и правил, заданных разработчиками. Они способны анализировать структуру и содержимое исходного текста, а затем генерировать новый, уникальный контент на основе этих данных. Принципы действия могут варьироваться в разных программных решениях, но основная идея заключается в автоматическом переписывании существующих текстов с сохранением смысла и синтаксиса.

Какие программные решения существуют для автоматической генерации контента?

Существует несколько программных решений для автоматической генерации контента. Некоторые из них включают Magic Article Rewriter, Power Article Rewriter, Article Rewrite Worker, WordFlood 2.0 и другие. Каждое из них имеет свои особенности и функциональность.

Что представляет собой Magic Article Rewriter?

Magic Article Rewriter - это программное решение, которое позволяет автоматически переписывать существующие статьи, сохраняя их смысл и структуру. Оно основано на алгоритмах обработки естественного языка и может быть использовано для создания уникальных текстов для веб-сайтов, блогов и других публикаций.

Какие еще существуют автоматические генераторы веб-контента?

Помимо упомянутых ранее программных решений, существует и другие автоматические генераторы веб-контента. Некоторые из них включают в себя ContentBot, ArticleForge, Articoolo и другие. Каждый из них имеет свои особенности и возможности для генерации уникального контента.

Как работает автоматизированная журналистика в современном глобальном мире?

Автоматизированная журналистика в современном глобальном мире основана на использовании специальных программных решений, которые генерируют контент автоматически. Эти программы используют алгоритмы и искусственный интеллект для создания новостных статей и других текстов. Они могут анализировать данные, составлять отчеты и даже писать интервью. Такой подход позволяет сократить время и трудозатраты на написание и редактирование статей.

Какие программные решения существуют для автоматизированной журналистики?

На сегодняшний день существует несколько программных решений для автоматизированной журналистики. Некоторые из них включают Magic article rewriter, Power Article Rewriter, Article Rewrite Worker, WordFlood 2.0 и другие. Эти программы предлагают различные функции, такие как переписывание статей, генерация ключевых слов и фраз, анализ и обработка данных и многое другое.

Что такое роботы-генераторы контента?

Роботы-генераторы контента - это программные решения, которые автоматически генерируют тексты и статьи на основе заданных параметров. Они используют алгоритмы и искусственный интеллект для создания уникального и качественного контента. Такие роботы могут быть полезны для автоматизации процесса написания статей, особенно при работе с большим объемом информации.