Загрузка файлов
This commit is contained in:
commit
c582a925c6
1
.gitignore
vendored
Normal file
1
.gitignore
vendored
Normal file
|
@ -0,0 +1 @@
|
||||||
|
/data/config.py
|
29
README.md
Normal file
29
README.md
Normal file
|
@ -0,0 +1,29 @@
|
||||||
|
# TG-Parser
|
||||||
|
Парсер участников и сообщений из ТГ-Чатов и чатов для комментариев в ТГ-Каналах
|
||||||
|
## Возможности
|
||||||
|
- Выгрузка участников групп/каналов(по чату для комментариев) в json, excel и txt
|
||||||
|
- Выгрузка истории групп/каналов(по чату для комментариев) в html и txt.
|
||||||
|
|
||||||
|
------------
|
||||||
|
|
||||||
|
## Установка
|
||||||
|
### Для Windows:
|
||||||
|
|
||||||
|
- Запустить ярлык с названием **Установка** в главном каталоге либо запустить **install.bat** из каталога **data**.
|
||||||
|
- На сайте https://my.telegram.org/auth получить **api_id** и **api_hash**
|
||||||
|
- Записать данные в файл **config.py.dist** и переименовать его в **config.py**
|
||||||
|
### Для Linux:
|
||||||
|
|
||||||
|
- Выполнить **pip install -r "requirements.txt"** из каталога **data**.
|
||||||
|
- На сайте https://my.telegram.org/auth получить **api_id** и **api_hash**
|
||||||
|
- Записать данные в файл **config.py.dist** и переименовать его в **config.py**
|
||||||
|
------------
|
||||||
|
|
||||||
|
## Использование
|
||||||
|
1. Запустить ярлык с названием **Запуск** в главном каталоге либо запустить **main.py** из каталога **data**.
|
||||||
|
1.1 При первом запуске скрипт запросит у вас номер телефона. Это необходимо, чтобы скрипт авторизировался под вашим аккаунтом и мог собирать данные о чатах/каналах.
|
||||||
|
2. Введите ссылку на чат/канал либо id чата/канала, в которых состоит пользователь, под чьим именем используется скрипт. Обратите внимание, что некоторые TG-клиенты показывают ID чатов/каналов, убирая значение **-100** от начала ID. Например:
|
||||||
|
- **-100123456789** - Правильно
|
||||||
|
- **123456789** - Неправильно
|
||||||
|
3. После получения списка участников в главном каталоге появятся директории **Чаты** и **Каналы** в которых, в зависимости от вашего выбора, появятся папки с вашими чатами/каналами с обработанными данными.
|
||||||
|
4. Скрипт предложит вам сохранить историю сообщений. При утвердительном выборе сообщения начнут записываться в те же папки. За формат вывода особая благодарность [@danila_ms](https://t.me/danila_ms)
|
2
data/config.py.dist
Normal file
2
data/config.py.dist
Normal file
|
@ -0,0 +1,2 @@
|
||||||
|
api_id = 213213124
|
||||||
|
api_hash = "asdawd23wd3hruid23"
|
3
data/install.bat
Normal file
3
data/install.bat
Normal file
|
@ -0,0 +1,3 @@
|
||||||
|
@echo off
|
||||||
|
python -m pip install -r requirements.txt
|
||||||
|
pause
|
135
data/main.py
Normal file
135
data/main.py
Normal file
|
@ -0,0 +1,135 @@
|
||||||
|
import json
|
||||||
|
from xlwt import Workbook
|
||||||
|
import xlwt
|
||||||
|
import config
|
||||||
|
import os
|
||||||
|
import asyncio
|
||||||
|
from my_functions import *
|
||||||
|
|
||||||
|
|
||||||
|
api_id = config.api_id
|
||||||
|
api_hash = config.api_hash
|
||||||
|
session = 'session.session'
|
||||||
|
loop = asyncio.get_event_loop()
|
||||||
|
|
||||||
|
try:
|
||||||
|
# Получаем чат пользователя, проверяем, что за ссылку он отправил и ожидаем правильной ссылки
|
||||||
|
while True:
|
||||||
|
link = input('Введите ссылку на чат: ')
|
||||||
|
# link = ('osint_flood')
|
||||||
|
res = check_link(link)
|
||||||
|
if not res:
|
||||||
|
print('Неверная ссылка. Попробуйте другую.')
|
||||||
|
elif res == 'url' or res == 'id':
|
||||||
|
if res == 'id':
|
||||||
|
res = loop.run_until_complete(check_chat(link, 'id'))
|
||||||
|
else:
|
||||||
|
res = loop.run_until_complete(check_chat(link, 'url'))
|
||||||
|
if res is not False:
|
||||||
|
members = res[0]
|
||||||
|
admins = res[1]
|
||||||
|
chat = res[2]
|
||||||
|
users = res[3]
|
||||||
|
channel_type = res[4]
|
||||||
|
channel_title = res[5]
|
||||||
|
break
|
||||||
|
elif res == 'close':
|
||||||
|
chat = loop.run_until_complete(inv_chat(link))
|
||||||
|
res = loop.run_until_complete(check_chat(chat, 'url'))
|
||||||
|
if res is not False:
|
||||||
|
members = res[0]
|
||||||
|
admins = res[1]
|
||||||
|
chat = res[2]
|
||||||
|
users = res[3]
|
||||||
|
channel_type = 'Чаты'
|
||||||
|
channel_title = chat.title
|
||||||
|
break
|
||||||
|
title = channel_title
|
||||||
|
for x in ['\\', '|', '"', '/', ':',
|
||||||
|
'?', '*', '<', '>']:
|
||||||
|
title = title.replace(x, ' ')
|
||||||
|
if os.path.exists(f'../Чаты') is False:
|
||||||
|
os.mkdir(f'../Чаты')
|
||||||
|
if os.path.exists(f'../Каналы') is False:
|
||||||
|
os.mkdir(f'../Каналы')
|
||||||
|
if os.path.exists(f'../{channel_type}/{title}') is False:
|
||||||
|
os.mkdir(f'../{channel_type}/{title}')
|
||||||
|
with open(f'../{channel_type}/{title}/Участники {title}.json', 'w', encoding='utf8') as f:
|
||||||
|
with open(f'../{channel_type}/{title}/Участники {title}.txt', 'w', encoding='utf8') as file:
|
||||||
|
all_users = {
|
||||||
|
'admins': admins,
|
||||||
|
'users': members
|
||||||
|
}
|
||||||
|
f.write(json.dumps(all_users, indent=4, ensure_ascii=False,))
|
||||||
|
if admins is not None:
|
||||||
|
file.write('Администраторы:\n')
|
||||||
|
for x in admins:
|
||||||
|
file.write(f'{str(admins[x])}\n')
|
||||||
|
if len(members)>0:
|
||||||
|
file.write('Пользователи:\n')
|
||||||
|
for x in members:
|
||||||
|
file.write(f'{str(members[x])}\n')
|
||||||
|
wb = Workbook()
|
||||||
|
style = xlwt.easyxf('pattern: pattern solid, fore_colour light_blue;'
|
||||||
|
'font: colour white, bold True;')
|
||||||
|
n_list = 1
|
||||||
|
sheet1 = wb.add_sheet(f'Users_{n_list}')
|
||||||
|
sheet1.write(0, 0, 'Администраторы', style)
|
||||||
|
sheet1.write(0, 1, 'ID', style)
|
||||||
|
sheet1.write(0, 2, 'First Name', style)
|
||||||
|
sheet1.write(0, 3, 'Last Name', style)
|
||||||
|
sheet1.write(0, 4, 'Username', style)
|
||||||
|
sheet1.write(0, 5, 'Телефон', style)
|
||||||
|
sheet1.write(0, 6, 'Бот', style)
|
||||||
|
sheet1.write(0, 7, 'Удалён', style)
|
||||||
|
sheet1.write(0, 8, 'Скам', style)
|
||||||
|
n = 1
|
||||||
|
q = 1
|
||||||
|
for x in users:
|
||||||
|
sheet1.col(0).width = 256 * 17
|
||||||
|
sheet1.col(1).width = 256 * 17
|
||||||
|
sheet1.col(2).width = 256 * 25
|
||||||
|
sheet1.col(3).width = 256 * 25
|
||||||
|
sheet1.col(4).width = 256 * 25
|
||||||
|
sheet1.col(5).width = 256 * 17
|
||||||
|
sheet1.col(6).width = 256 * 7
|
||||||
|
sheet1.col(7).width = 256 * 7
|
||||||
|
sheet1.col(8).width = 256 * 7
|
||||||
|
sheet1.write(n, 0, x['admin'])
|
||||||
|
sheet1.write(n, 1, x['id'])
|
||||||
|
sheet1.write(n, 2, x['first_name'])
|
||||||
|
sheet1.write(n, 3, x['last_name'])
|
||||||
|
sheet1.write(n, 4, x['username'])
|
||||||
|
sheet1.write(n, 5, x['phone'])
|
||||||
|
sheet1.write(n, 6, x['bot'])
|
||||||
|
sheet1.write(n, 7, x['deleted'])
|
||||||
|
sheet1.write(n, 8, x['scam'])
|
||||||
|
n += 1
|
||||||
|
q += 1
|
||||||
|
if n == 30000:
|
||||||
|
n_list += 1
|
||||||
|
sheet1 = wb.add_sheet(f'Users_{n_list}"')
|
||||||
|
n = 1
|
||||||
|
wb.save(f'../{channel_type}/{title}/Участники {title}.xls')
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
while True:
|
||||||
|
otvet = input('''\nЖелаете ли вы сохранить историю сообщений?
|
||||||
|
1 - да
|
||||||
|
2 - нет ''')
|
||||||
|
if str(otvet) == '1' or str(otvet) == '2':
|
||||||
|
break
|
||||||
|
if str(otvet) == '1':
|
||||||
|
loop.run_until_complete(dump_messages(chat, title))
|
||||||
|
input('\nСканирование закончено. Можете нажать "Enter", чтобы закрыть окно.')
|
||||||
|
|
||||||
|
except Exception as e:
|
||||||
|
print(f'''Упс... Возникла ошибка
|
||||||
|
Текст ошибки:
|
||||||
|
|
||||||
|
{e}
|
||||||
|
|
||||||
|
Отправьте скриншот разработчику.''')
|
||||||
|
raise e
|
||||||
|
input('\nНажмите "Enter", чтобы закрыть окно.')
|
220
data/my_functions.py
Normal file
220
data/my_functions.py
Normal file
|
@ -0,0 +1,220 @@
|
||||||
|
import re
|
||||||
|
import config
|
||||||
|
from telethon.sync import TelegramClient
|
||||||
|
from telethon.tl.types import ChannelParticipantsAdmins
|
||||||
|
from telethon import functions, errors
|
||||||
|
from progress.spinner import Spinner
|
||||||
|
|
||||||
|
api_id = config.api_id
|
||||||
|
api_hash = config.api_hash
|
||||||
|
session = 'session.session'
|
||||||
|
|
||||||
|
|
||||||
|
async def inv_chat(link):
|
||||||
|
hash = link.rsplit('/', 1)[1]
|
||||||
|
async with TelegramClient(session, api_id, api_hash) as client:
|
||||||
|
try:
|
||||||
|
await client(functions.messages.ImportChatInviteRequest(
|
||||||
|
hash=hash))
|
||||||
|
res = await client(functions.messages.CheckChatInviteRequest(
|
||||||
|
hash=hash
|
||||||
|
))
|
||||||
|
if res.chat.megagroup is False:
|
||||||
|
print(
|
||||||
|
'Похоже, вы отправили ссылку на закрытый канал. Уьедитесь, что вы собираете информацию из группы.')
|
||||||
|
exit()
|
||||||
|
except errors.ChannelsTooMuchError:
|
||||||
|
print('Вы вступили в слишком большое количество чатов')
|
||||||
|
exit()
|
||||||
|
except errors.InviteHashEmptyError:
|
||||||
|
print('Хеш приглашения пуст.')
|
||||||
|
exit()
|
||||||
|
except errors.InviteHashExpiredError:
|
||||||
|
print('Срок действия чата, к которому пользователь пытался присоединиться, истек, и он больше не действителен.')
|
||||||
|
exit()
|
||||||
|
except errors.InviteHashInvalidError:
|
||||||
|
print('Недействительная ссылка.')
|
||||||
|
exit()
|
||||||
|
except errors.SessionPasswordNeededError:
|
||||||
|
print('Включена двухэтапная проверка, требуется пароль.')
|
||||||
|
exit()
|
||||||
|
except errors.UsersTooMuchError:
|
||||||
|
print('Превышено максимальное количество пользователей (например, для создания чата).')
|
||||||
|
exit()
|
||||||
|
except errors.UserAlreadyParticipantError:
|
||||||
|
res = await client(functions.messages.CheckChatInviteRequest(
|
||||||
|
hash=hash
|
||||||
|
))
|
||||||
|
return res.chat
|
||||||
|
|
||||||
|
|
||||||
|
async def check_chat(chat, type_link):
|
||||||
|
# Проверка на то, является ли ссылка на чат чатом с последующей выгрузкой участников
|
||||||
|
async with TelegramClient('session', api_id, api_hash) as client:
|
||||||
|
try:
|
||||||
|
if type_link == 'id':
|
||||||
|
ch = await client.get_entity(int(chat))
|
||||||
|
else:
|
||||||
|
ch = await client.get_entity(chat)
|
||||||
|
channel_type = 'Чаты'
|
||||||
|
if ch.__class__.__name__ == 'Channel':
|
||||||
|
if ch.megagroup is False:
|
||||||
|
res = await client(functions.channels.GetFullChannelRequest(
|
||||||
|
channel=ch
|
||||||
|
))
|
||||||
|
if len(res.chats) != 2:
|
||||||
|
print("Канал не имеет закреплённого чата для комментариев")
|
||||||
|
return False
|
||||||
|
else:
|
||||||
|
channel_type = 'Каналы'
|
||||||
|
channel_title = ch.title
|
||||||
|
ch = await client.get_entity(res.chats[1])
|
||||||
|
count_members = await client(functions.channels.GetFullChannelRequest(channel=ch))
|
||||||
|
count_members = count_members.full_chat.participants_count
|
||||||
|
if count_members > 10000:
|
||||||
|
print(f'Количество участников чата "{ch.title}" насчитывает более 10 тысяч человек. Выбран "обычный" + "агрессивный" режим.')
|
||||||
|
aggressive = True
|
||||||
|
else:
|
||||||
|
print(f'Количество участников чата "{ch.title}" насчитывает менее 10 тысяч человек. Выбран "обычный" режим.')
|
||||||
|
aggressive = False
|
||||||
|
admins = []
|
||||||
|
titles = {}
|
||||||
|
async for user in client.iter_participants(ch, filter=ChannelParticipantsAdmins):
|
||||||
|
admins.append(user)
|
||||||
|
title = await client.get_permissions(ch, user)
|
||||||
|
titles[f'{title.participant.user_id}'] = title.participant.rank
|
||||||
|
if len(admins) == 0:
|
||||||
|
admins = None
|
||||||
|
else:
|
||||||
|
admins = list_users(admins, titles)
|
||||||
|
members = await client.get_participants(ch, aggressive=False)
|
||||||
|
if len(members) == 0:
|
||||||
|
members = None
|
||||||
|
else:
|
||||||
|
members = list_users(members)
|
||||||
|
if aggressive is True:
|
||||||
|
ag_members = await client.get_participants(ch, aggressive=True)
|
||||||
|
if len(ag_members) == 0:
|
||||||
|
ag_members = None
|
||||||
|
else:
|
||||||
|
ag_members = list_users(ag_members)
|
||||||
|
members = {**members, **ag_members}
|
||||||
|
if channel_type == 'Каналы':
|
||||||
|
limit = 3000
|
||||||
|
print(
|
||||||
|
f'Собираем сообщения. В зависимости от ваших прошлый запросов, действие может занять продолжительное время.\n'
|
||||||
|
f'Лимит - {limit}')
|
||||||
|
mess = await client(functions.messages.GetHistoryRequest(
|
||||||
|
peer=ch,
|
||||||
|
offset_id=0,
|
||||||
|
offset_date=None,
|
||||||
|
add_offset=0,
|
||||||
|
limit=limit,
|
||||||
|
max_id=0,
|
||||||
|
min_id=0,
|
||||||
|
hash=0
|
||||||
|
))
|
||||||
|
mess_user = list_users(mess.users)
|
||||||
|
members = {**members, **mess_user}
|
||||||
|
users = []
|
||||||
|
for x in members:
|
||||||
|
user = {}
|
||||||
|
if admins is not None:
|
||||||
|
if str(members[x]['id']) in admins:
|
||||||
|
user['admin'] = admins[str(members[x]['id'])]['title']
|
||||||
|
else:
|
||||||
|
user['admin'] = ''
|
||||||
|
else:
|
||||||
|
user['admin'] = ''
|
||||||
|
user['id'] = members[x]['id']
|
||||||
|
user['first_name'] = members[x]['first_name']
|
||||||
|
if members[x]['last_name'] is None:
|
||||||
|
user['last_name'] = ''
|
||||||
|
else:
|
||||||
|
user['last_name'] = members[x]['last_name']
|
||||||
|
if members[x]['username'] is None:
|
||||||
|
user['username'] = ''
|
||||||
|
else:
|
||||||
|
user['username'] = members[x]['username']
|
||||||
|
if members[x]['phone'] is None:
|
||||||
|
user['phone'] = ''
|
||||||
|
else:
|
||||||
|
user['phone'] = members[x]['phone']
|
||||||
|
if members[x]['bot'] is False:
|
||||||
|
user['bot'] = ''
|
||||||
|
else:
|
||||||
|
user['bot'] = 'True'
|
||||||
|
if members[x]['deleted'] is False:
|
||||||
|
user['deleted'] = ''
|
||||||
|
else:
|
||||||
|
user['deleted'] = 'True'
|
||||||
|
if members[x]['scam'] is False:
|
||||||
|
user['scam'] = ''
|
||||||
|
else:
|
||||||
|
user['scam'] = 'True'
|
||||||
|
users.append(user)
|
||||||
|
print(channel_type)
|
||||||
|
if channel_type != 'Каналы':
|
||||||
|
channel_title = ch.title
|
||||||
|
return members, admins, ch, users, channel_type, channel_title
|
||||||
|
else:
|
||||||
|
print('Вы ввели ссылку, которая не ведёт на открытую группу. Попробуйте другую.')
|
||||||
|
return False
|
||||||
|
except ValueError as e:
|
||||||
|
return False
|
||||||
|
|
||||||
|
|
||||||
|
async def dump_messages(chat, title):
|
||||||
|
"""Выгружаем сообщения"""
|
||||||
|
async with TelegramClient(session, api_id, api_hash) as client:
|
||||||
|
with open(f'../Чаты/{title}/Сообщения {title}.txt', 'w', encoding='utf8') as file:
|
||||||
|
with open(f'../Чаты/{title}/Сообщения {title}.html', 'w', encoding='utf8') as f:
|
||||||
|
async for message in client.iter_messages(chat):
|
||||||
|
file.write(f'{message}\n')
|
||||||
|
if message.media is not None:
|
||||||
|
f.write(
|
||||||
|
f'<fieldset><legend>{message.from_id} | {message.date} </legend>Image. <br>{message.message}<br><br><small>Message id:{message.id}</small></fieldset>\n')
|
||||||
|
else:
|
||||||
|
f.write(
|
||||||
|
f'<fieldset><legend>{message.from_id} | {message.date} </legend>{message.message}<br><br><small>{message}</small></fieldset>\n')
|
||||||
|
|
||||||
|
|
||||||
|
def check_link(link):
|
||||||
|
try:
|
||||||
|
if int(link):
|
||||||
|
return 'id'
|
||||||
|
except Exception as e:
|
||||||
|
pass
|
||||||
|
"""Проверяем ссылку регуляркой и определяем, что хочет пользователь"""
|
||||||
|
if re.match(r'https://t.me/joinchat/[a-z-_0-9]{1}[a-z-_0-9]{4,}$', link.lower()) or re.match(
|
||||||
|
r'http://t.me/joinchat/[a-z-_A-Z0-9]{1}[a-z-_0-9]{4,}$', link.lower()):
|
||||||
|
return 'close'
|
||||||
|
elif re.match(r'https://t.me/[a-z]{1}[a-z_0-9]{4,31}$', link.lower()) or re.match(
|
||||||
|
r'@[a-z]{1}[a-z_0-9]{4,31}$', link.lower()) or re.match(
|
||||||
|
r'[a-z]{1}[a-z_0-9]{4,31}$', link.lower()
|
||||||
|
):
|
||||||
|
return 'url'
|
||||||
|
else:
|
||||||
|
return False
|
||||||
|
|
||||||
|
|
||||||
|
def list_users(*args):
|
||||||
|
members = args[0]
|
||||||
|
users = {}
|
||||||
|
for user in members:
|
||||||
|
users[f'{user.id}'] = {
|
||||||
|
'id': user.id,
|
||||||
|
'first_name': user.first_name,
|
||||||
|
'last_name': user.last_name,
|
||||||
|
'username': user.username,
|
||||||
|
'phone': user.phone,
|
||||||
|
'bot': user.bot,
|
||||||
|
'deleted': user.deleted,
|
||||||
|
'scam': user.scam,
|
||||||
|
}
|
||||||
|
if len(args) == 2:
|
||||||
|
titles = args[1]
|
||||||
|
for key, value in titles.items():
|
||||||
|
users[key]['title'] = value
|
||||||
|
return users
|
||||||
|
|
2
data/requirements.txt
Normal file
2
data/requirements.txt
Normal file
|
@ -0,0 +1,2 @@
|
||||||
|
telethon==1.22.0
|
||||||
|
xlwt==1.3.0
|
BIN
Запуск.lnk
Normal file
BIN
Запуск.lnk
Normal file
Binary file not shown.
BIN
Установка.lnk
Normal file
BIN
Установка.lnk
Normal file
Binary file not shown.
Loading…
Reference in New Issue
Block a user