Суть задачи
Темы хакатона SocialHack
1. Обогащение данных
2. Обработка/ Анализ
3. Продукт/ внутренние и внешние сервисы
4. Market
Обогащение данных:
– Как обогащать данные: дополнительные ресурсы;
– В БД адреса идут текстом, надо превратить их в ГЕОПОИНТЫ (валидация данных, поиск и проверка соответствующего адреса);
– Что нужно искать и как (алгоритм поиска);
– Статистика по БД и данным;
– Качество заполненных данных;
– Живость НКО (все ли подают отчету, какой % подали письмо, но не отчитались);
Анализ
– Динамика по НКО за период 2015 — 2017 согласно отчетам;
– Геокарта НКО (на основе которой можно визуализировать данные);
– Алгоритм проверки данных в отчетах: как проверять корректность заполнения отчетов на объеме 200к шт; (Валидация полей парса)
– Классификатор типов НКО – Классификатор деятельности – data science – … – profit!1 (как массу которая есть проверить и протегировать машинным способом)
Сервисы:
– Полнотекстовый, свободный поиск на основе данных (по каким полям, на основе чего);
– Алгоритм который позволит на основе data sciеnce понять чем занимается НКО в действительности;
– It-решения для городских инициатив sharing economy
Комментарии