Требуется СтатАнализ и Инфографика. "Инвалидность и реабилитация" каталог "Одноклассников"

Упоминание на сайте и/или в соцсетях

По имеющимся цифровым данным в формате xls Требуются Рекомендации
1) по выбору (из числового списка в формате xls) групп пользователей "Одноклассников" для статанализа,
2) по статанализу (из числового списка в формате xls) количества пользователей, зарегистрированных в нескольких группах
2) по визуализации (из числового списка в формате xls) полученных результатов.
Общее представление о проекте и уже собранных данных можно получить на странице http://invamagazine.ru/sns/katalog.html
Пример исходных данных в формате xls можно скачать по адресу http://invamagazine.ru/ok_exp.zip

На текущем этапе редакция газеты ставит своей целью оценить количество пользователей соцсети «Одноклассники», в сферу интересов которых входит тема «Инвалидность и реабилитация».
Механическое сложение цифр участников отдельных групп даёт лишь приблизительное значение, поскольку многие пользователи зарегистрированы в нескольких группах.
Имея распределение численности групп и, сравнив состав нескольких групп по ID участников, можно сделать статистическую оценку реального количества пользователей.

Помощь нужна
Андрей Анисимов

Андрей Анисимов

Об организации / проекте

газета "Здравствуйте, люди!". УЧРЕДИТЕЛЬ Нижегородская областная организация имени Александра Невского общероссийской общественной организации «Всероссийское общество инвалидов».

О газете http://invamagazine.ru/zl/about.htm

Проект не имеет заказчика и финансирования.
Предложения по расширению и углублению приветствуются 🙂

Дополнительно интересно проанализировать статистику причин, которые привели пользователей в тематические группы.
Раздельно для групп, ориентированных на родителей детей-инвалидов и на пенсионеров. Раздельно для групп, ориентированных на инвалидов по зрению и раздельно по слуху, и т.д.

Комментарии
  1. Глеб Суворов
    Глеб Суворов /

    могу помочь по вконтакте, но в августе, если будет актуально.

    • Андрей Анисимов
      Андрей Анисимов /

      До ВКонтакте руки дойдут не раньше осени. По Одноклассникам УЖЕ есть подборка примерно 2200 адресов групп, разделённая по тематике и целевым группам. Есть суммарная численность всех групп. Нет понимания, сколько уникальных пользователей зарегистрировано в этих группах. Очевидный способ оценки количества уникальных пользователей — сравнение состава нескольких групп по их ID (пример http://invamagazine.ru/ok_exp.zip), отобранных по какой то методике. Методика отбора не ясна 🙂

      • Nikita Molostvov
        Nikita Molostvov /

        https://apiok.ru/wiki/display/api/group.getMembers+ru
        Если я правильно понимаю, вернет ИД пользователей группы. Таким образом можно получить всех пользователей в этих группах и убрать дубли. Потом по всем пользователям попробовать получить остальную Информацию.

  2. Андрей Анисимов
    Андрей Анисимов /

    Безусловно это самый правильный путь. Пересечение пользователей в двух больших группах колеблется от 1,5% до 15% от суммы. А при сравнении ID участников мелких групп — до 30 из 50 человек общего состава группы вписаны хотя бы в одну из 4-х групп численностью около 10.000 человек (сравнение проводилось в рамках одной тематики).
    ID пользователей группы я могу получить и без apiok.ru (пример http://invamagazine.ru/ok_exp.zip), но получать и потом сравнивать ID пользователей 2200 групп… хотелось бы ограничиться незначительным процентом и стат анализом 🙂 . Но если кто то готов автоматизировать процесс получения ID всех 2200 групп в один столбец с последующей сортировкой по возрастанию и сравнением (например в .xls примитивной командой =СОВПАД(A1;A2)) , то конечно это вариант, по итогам которого исполнитель получит интересный фактический материал как для статьи, так и для практического использования. ИМХО конечно. PS Значительная часть групп закрыта для посторонних и списки их участников получить будет … поэтому статанализ кажется безальтернативным…

Оставить комментарий
Присоединяйтесь к нам!
Вы заработали 10 очков опыта!