Завдання

Моніторинговий проект “Око”

Моніторингова програма світових медіа щодо згадок про Україну. Заснований у вересні 2014 року ГО “Razom for Ukraine” (США) та ГО “Агенція іміджу України” (Київ) для моніторингу іміджу України у світових ЗМІ через відсутність аналогічних проектів в державі. Проект складається із

  1. автоматичної моніторингової програми на основі Google та Bing – яка сортує статті про Україну за мовами, датою, їхньою популярністю у Facebook та Twitter; волонтери окремо сортують вручну ці матеріали відповідно до теми публікації про Україну та іміджового сентименту – позитивного, негативного чи нейтрального.
  2. аналітичної бази статей про Україну 12-ма мовами за 1,5 роки.

Проект призначений для використання аналітичними інституціями, посольствами, журналістами Big Data, для вивчення іміджу України, впливу онлайн-медіа на демократичні процеси, вибори, референдуми, виявлення пропаганди.

Сайт: http://www.ukroko.org
Facebook: https://www.facebook.com/monitoringoko/

Завдання

Домашнє завдання є повністю опціональним і не впливає на отримання сертифікату закінчення курсу.

Домашнє завдання (на вибір):
1) Автоматичний факт-чекінг статей з бази ОКО про Україну з присвоєнням trust index (індекс зради), наскільки можна довіряти цій статті.
2) Аналіз статей з бази ОКО в media про Україну, в простому варіанті це ставлення до України, тренди, як поліпшити імідж України.
3) Автоматичне визначення тем (з заданого переліку) непроанотованих статтей з бази ОКО.
4) Комбінація запропонованих або свої варіанти

Дані для аналізу (вибірка реальних даних проекту ОКО)

Таблиця “Pages”
CSV формат https://drive.google.com/open?id=0B1YZ1g4b-sj5a1dhS0YybVdKSzg
JSON формат https://drive.google.com/open?id=0B1YZ1g4b-sj5YVhGNTh0SzlzQjg

Поля

  • Url – Url лінк на статтю
  • PubAt – дата публікації
  • Title – заголовок
  • SocialFb – Engagement rate (сума лайків, поширень та коментарів Facebook)
  • SocialSyncAt – дата останнього оновлення значення “SocialFb”
  • Author – автор статті
  • Domain – домен, на якому була опублікована стаття
  • EditorialTopic – тема статті з переліку “Topics” (якщо задана – стаття була проанотована експертом)
  • EditorNames – імена анотаторів
  • Language – мова
  • Text -текст статті

Таблиця “Topics”
CSV формат https://drive.google.com/open?id=0B1YZ1g4b-sj5c3RNSFpxa1NVRjQ
JSON формат https://drive.google.com/open?id=0B1YZ1g4b-sj5dXlsLUVtMjVHZkk

Вимоги

  • Мова реалізації на вибір (перевага надається використанню iPython notebook для простоти презентації коду)
  • Презентація виконаного завдання у презентації (до 7 слайдів)

Роботи (презентацію і код) надсилати на адресу shypovych@gmail.com з темою листа “OKO Project” до 9:00 ранку 11 вересня.

Троє фіналістів презентуватимуть свої роботи о 16:00 11 вересня, після чого відбудеться вибір переможця. Час презентації – 5 хвилин.

Призи

Публікації результатів роботи трьох фіналістів та інтелектуальний приз-сюрприз для головного переможця.