Парсер комментаторов в сообществе Reddit (посты New, Top, Hot)
Данный скрипт собирает список пользователей, которые комментировали посты в определенном сабреддите на Reddit. Результаты сохраняются в файл Microsoft Excel (*. xlsx) со списком имен авторов и ссылками на аккаунты.
Для работы данного парсера у вас должен быть установлен Python. Скачать можно здесь. Работоспособность данного парсера тестировалась на версии Python 3.9.1.
- Для запуска парсера на Python для сбора комментаторов постов, установите необходимые библиотеки, если они ещё не установлены:
pip install praw
pip install praw pandas openpyxl
2. Вставьте свои client_id, client_secret и user_agent в соответствующие переменные в скрипте reddit_comment_author.py (6-8 строки). Например открыв файл через Notepad++.

Эти данные можно получить, создав приложение типа "script" на Reddit App Preferences.
Взять их можно здесь:

3. Запустите скрипт:
python reddit_comment_author.py
Можно просто кликнуть по файлу.
Скрипт запросит у вас имя сабреддита и количество постов для парсинга.

После окончания работы скрипта все данные с логинами пользователей коментировавших посты сохраняться в файл Microsoft Excel (*. xlsx). Сохраняются такие данные как имя пользователя и ссылка на аккаунт.
По умолчанию в скрипте стоит парсинг последних 10 постов. Вы можете поменять этот лимит на свое усмотрение. Для этого нужно заменить значение post_limit на 12 строке кода:

По умолчанию скрипт собирает комментаторов с новых постов (New). Можно поменять чтобы собирались комментаторы с ТОП-постов (Top), или горячих (Hot). Для этого на 18 строке нужно заменить значение subreddit.new на subreddit.top или subreddit.hot соответственно.



