Sereja's blog

By Sereja, 10 years ago, In Russian

Всем привет.

Хотел бы рассказать про наш(я и M0sTik) проект. Над которым уже некоторое время идет работа.

Суть в том, что я заметил, что ВКонтакте появилось немереное количество публичных страниц. Каждая из них поначалу предоставляет интересные посты, на затем "порох" заканчивается и по сути идет полнейший треш. Плохие группы исчезают, хорошие появляются но пользователям лень переходить из группы в группу, они просто сидят на старых пабликах и читают все, из которых 1/3 это что то нормальное, 1/3 плоский юмор и 1/3 реклама. Да и на новых, хороших пабликах обязательно находится то, что явно не хочется читать.

В общем как то мне пришла в голову идея сделать публичную страницу, которая сможет отбирать лучшее из существующего, так сказать высшая степень лени :). Так его и назвали LNT(ЛеНТяй).

Для тех, кто уже захотел это увидеть, вот ссылка: LNT.

Запущен он был пару дней назад. За чуть больше суток тут уже больше 70 постов. Пост здесь немного отличается от обычного паблика. Если в одном посте обычного паблика лежит в среднем одна фотография, то мы делаем подборки по группам. Почему? Ответ тут, это две причины:
1). Прочитал я, что ВКонтакте делает ограничение на количество публикаций, если не писать ту большую схему, то можно сказать грубо: один пост в десять минут. Этого мало, учитывая объемы постов, с которыми мы работаем, а так же разноплановость аудитории, которой хочется достичь.
2). Причина крайне банальна, не стоит мешать соль с сахаром. Есть люди, которым нравится "парашный" юмор и провокации, есть интеллигенты, а есть и дамы. У каждого свои вкусы. Группировка по пабликам, это хорошее решение, как по мне.
Таким образом за день тут накапливается колоссальное количество публикаций. По текущим результатам подборки выходят не столь и плохими(когда как). Некоторым это может и не нравится, всем не угодишь. Но подборки ориентированы на общую массу.

Теперь по поводу "мозга, сердца и мышц" нашего паблика(алгоритм и код):
Основная работа состоит из нескольких основных кусков:
1). искать
2). выбирать
3). публиковать
Вся техническая часть, и конечно же масса кода лежит в первом и третьем пункте. Второй пункт это основная алгоритмическая часть. Собственно тут еще лежит куча доработок и оптимизаций. Полностью всю логику я не могу тут написать, но суть тут лежит в следующей оптимизационной задаче:
в реальном времени Вам поступает публикация, в которой есть информация, картинки, вложения, лайки, репосты, комментарии, время публикации, размер публики страницы. В короткие сроки( ~ 10 минут), определить хорош ли он, или нет. Как упражнение, можете сами подумать над этой задачей, скажу, что тут можно придумать массу всяких способов выбора. Но в целом, это очень интересно.
Проблема такой задачи, тяжкий и долгий дебаг. Что бы убедиться, что тут публикуется то что нужно , ждать приходится около дня, пока весь анализ выполнит свою работу.

Помимо основной части, тут еще нужно доработать и создать не мало деталей.

Еще чуть чуть, и думаю можно начинать полноценную рекламу всего этого.

Интересно услышать Ваши отзывы по этому поводу.

P.S. Просьба не кричать, что я тут развращаю аудиторию, своими публикациями, я этого очень не хочу :).

  • Vote: I like it
  • +29
  • Vote: I do not like it