Add testreplay chat
This commit is contained in:
@@ -1,4 +1,4 @@
|
|||||||
import logging
|
import logging
|
||||||
LOGGER_MODE = logging.ERROR
|
LOGGER_MODE = logging.DEBUG
|
||||||
headers = {
|
headers = {
|
||||||
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 Safari/537.36'}
|
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 Safari/537.36'}
|
||||||
|
|||||||
271
pytchat/core_multithread/replaychat.py
Normal file
271
pytchat/core_multithread/replaychat.py
Normal file
@@ -0,0 +1,271 @@
|
|||||||
|
import requests
|
||||||
|
import datetime
|
||||||
|
import json
|
||||||
|
import random
|
||||||
|
import signal
|
||||||
|
import threading
|
||||||
|
import time
|
||||||
|
import traceback
|
||||||
|
import urllib.parse
|
||||||
|
from concurrent.futures import CancelledError, ThreadPoolExecutor
|
||||||
|
from .buffer import Buffer
|
||||||
|
from .replayparser import Parser
|
||||||
|
from .. import config
|
||||||
|
from .. import mylogger
|
||||||
|
from ..exceptions import ChatParseException,IllegalFunctionCall
|
||||||
|
from ..paramgen import arcparam
|
||||||
|
from ..processors.default.processor import DefaultProcessor
|
||||||
|
|
||||||
|
logger = mylogger.get_logger(__name__,mode=config.LOGGER_MODE)
|
||||||
|
MAX_RETRY = 10
|
||||||
|
headers = config.headers
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
class ReplayChat:
|
||||||
|
''' スレッドプールを利用してYouTubeのライブ配信のチャットデータを取得する
|
||||||
|
|
||||||
|
Parameter
|
||||||
|
---------
|
||||||
|
video_id : str
|
||||||
|
動画ID
|
||||||
|
|
||||||
|
processor : ChatProcessor
|
||||||
|
チャットデータを加工するオブジェクト
|
||||||
|
|
||||||
|
buffer : Buffer(maxsize:20[default])
|
||||||
|
チャットデータchat_componentを格納するバッファ。
|
||||||
|
maxsize : 格納できるchat_componentの個数
|
||||||
|
default値20個。1個で約5~10秒分。
|
||||||
|
|
||||||
|
interruptable : bool
|
||||||
|
Ctrl+Cによる処理中断を行うかどうか。
|
||||||
|
|
||||||
|
callback : func
|
||||||
|
_listen()関数から一定間隔で自動的に呼びだす関数。
|
||||||
|
|
||||||
|
done_callback : func
|
||||||
|
listener終了時に呼び出すコールバック。
|
||||||
|
|
||||||
|
direct_mode : bool
|
||||||
|
Trueの場合、bufferを使わずにcallbackを呼ぶ。
|
||||||
|
Trueの場合、callbackの設定が必須
|
||||||
|
(設定していない場合IllegalFunctionCall例外を発生させる)
|
||||||
|
|
||||||
|
Attributes
|
||||||
|
---------
|
||||||
|
_executor : ThreadPoolExecutor
|
||||||
|
チャットデータ取得ループ(_listen)用のスレッド
|
||||||
|
|
||||||
|
_is_alive : bool
|
||||||
|
チャット取得を終了したか
|
||||||
|
'''
|
||||||
|
|
||||||
|
_setup_finished = False
|
||||||
|
#チャット監視中のListenerのリスト
|
||||||
|
_listeners= []
|
||||||
|
def __init__(self, video_id,
|
||||||
|
seektime =0,
|
||||||
|
processor = DefaultProcessor(),
|
||||||
|
buffer = Buffer(maxsize = 20),
|
||||||
|
interruptable = True,
|
||||||
|
callback = None,
|
||||||
|
done_callback = None,
|
||||||
|
direct_mode = False
|
||||||
|
):
|
||||||
|
self.video_id = video_id
|
||||||
|
self.seektime= seektime
|
||||||
|
self.processor = processor
|
||||||
|
self._buffer = buffer
|
||||||
|
self._callback = callback
|
||||||
|
self._done_callback = done_callback
|
||||||
|
self._executor = ThreadPoolExecutor(max_workers=2)
|
||||||
|
self._direct_mode = direct_mode
|
||||||
|
self._is_alive = True
|
||||||
|
self._parser = Parser()
|
||||||
|
self._setup()
|
||||||
|
|
||||||
|
if not ReplayChat._setup_finished:
|
||||||
|
ReplayChat._setup_finished = True
|
||||||
|
if interruptable:
|
||||||
|
signal.signal(signal.SIGINT, (lambda a, b:
|
||||||
|
(ReplayChat.shutdown(None,signal.SIGINT,b))
|
||||||
|
))
|
||||||
|
ReplayChat._listeners.append(self)
|
||||||
|
|
||||||
|
def _setup(self):
|
||||||
|
#direct modeがTrueでcallback未設定の場合例外発生。
|
||||||
|
if self._direct_mode:
|
||||||
|
if self._callback is None:
|
||||||
|
raise IllegalFunctionCall(
|
||||||
|
"direct_mode=Trueの場合callbackの設定が必須です。")
|
||||||
|
else:
|
||||||
|
#direct modeがFalseでbufferが未設定ならばデフォルトのbufferを作成
|
||||||
|
if self._buffer is None:
|
||||||
|
self._buffer = Buffer(maxsize = 20)
|
||||||
|
#callbackが指定されている場合はcallbackを呼ぶループタスクを作成
|
||||||
|
if self._callback is None:
|
||||||
|
pass
|
||||||
|
else:
|
||||||
|
#callbackを呼ぶループタスクの開始
|
||||||
|
self._executor.submit(self._callback_loop,self._callback)
|
||||||
|
#_listenループタスクの開始
|
||||||
|
listen_task = self._executor.submit(self._startlisten)
|
||||||
|
#add_done_callbackの登録
|
||||||
|
if self._done_callback is None:
|
||||||
|
listen_task.add_done_callback(self.finish)
|
||||||
|
else:
|
||||||
|
listen_task.add_done_callback(self._done_callback)
|
||||||
|
|
||||||
|
def _startlisten(self):
|
||||||
|
"""最初のcontinuationパラメータを取得し、
|
||||||
|
_listenループのタスクを作成し開始する
|
||||||
|
"""
|
||||||
|
initial_continuation = self._get_initial_continuation()
|
||||||
|
if initial_continuation is None:
|
||||||
|
self.terminate()
|
||||||
|
logger.debug(f"[{self.video_id}]No initial continuation.")
|
||||||
|
return
|
||||||
|
self._listen(initial_continuation)
|
||||||
|
|
||||||
|
def _get_initial_continuation(self):
|
||||||
|
''' チャットデータ取得に必要な最初のcontinuationを取得する。'''
|
||||||
|
try:
|
||||||
|
initial_continuation = arcparam.get(self.video_id,self.seektime)
|
||||||
|
except ChatParseException as e:
|
||||||
|
self.terminate()
|
||||||
|
logger.debug(f"[{self.video_id}]Error:{str(e)}")
|
||||||
|
return
|
||||||
|
except KeyError:
|
||||||
|
logger.debug(f"[{self.video_id}]KeyError:"
|
||||||
|
f"{traceback.format_exc(limit = -1)}")
|
||||||
|
self.terminate()
|
||||||
|
return
|
||||||
|
return initial_continuation
|
||||||
|
|
||||||
|
def _listen(self, continuation):
|
||||||
|
''' continuationに紐付いたチャットデータを取得し
|
||||||
|
にチャットデータを格納、
|
||||||
|
次のcontinuaitonを取得してループする
|
||||||
|
|
||||||
|
Parameter
|
||||||
|
---------
|
||||||
|
continuation : str
|
||||||
|
次のチャットデータ取得に必要なパラメータ
|
||||||
|
'''
|
||||||
|
try:
|
||||||
|
with requests.Session() as session:
|
||||||
|
while(continuation and self._is_alive):
|
||||||
|
livechat_json = (
|
||||||
|
self._get_livechat_json(continuation, session, headers)
|
||||||
|
)
|
||||||
|
metadata, chatdata = self._parser.parse( livechat_json )
|
||||||
|
#チャットデータを含むコンポーネントを組み立ててbufferに投入する
|
||||||
|
timeout = metadata['timeoutMs']/1000
|
||||||
|
chat_component = {
|
||||||
|
"video_id" : self.video_id,
|
||||||
|
"timeout" : timeout,
|
||||||
|
"chatdata" : chatdata
|
||||||
|
}
|
||||||
|
time_mark =time.time()
|
||||||
|
if self._direct_mode:
|
||||||
|
self._callback(
|
||||||
|
self.processor.process([chat_component])
|
||||||
|
)
|
||||||
|
else:
|
||||||
|
self._buffer.put(chat_component)
|
||||||
|
#次のchatを取得するまでsleepする
|
||||||
|
diff_time = timeout - (time.time()-time_mark)
|
||||||
|
if diff_time < 0 : diff_time=0
|
||||||
|
time.sleep(diff_time)
|
||||||
|
#次のチャットデータのcontinuationパラメータを取り出す。
|
||||||
|
continuation = metadata.get('continuation')
|
||||||
|
|
||||||
|
#whileループ先頭に戻る
|
||||||
|
except ChatParseException as e:
|
||||||
|
logger.error(f"{str(e)}(動画ID:\"{self.video_id}\")")
|
||||||
|
return
|
||||||
|
except (TypeError , json.JSONDecodeError) :
|
||||||
|
logger.error(f"{traceback.format_exc(limit = -1)}")
|
||||||
|
return
|
||||||
|
|
||||||
|
logger.debug(f"[{self.video_id}]チャット取得を終了しました。")
|
||||||
|
|
||||||
|
def _get_livechat_json(self, continuation, session, headers):
|
||||||
|
'''
|
||||||
|
チャットデータが格納されたjsonデータを取得する。
|
||||||
|
'''
|
||||||
|
continuation = urllib.parse.quote(continuation)
|
||||||
|
livechat_json = None
|
||||||
|
status_code = 0
|
||||||
|
url =(
|
||||||
|
f"https://www.youtube.com/live_chat_replay/get_live_chat_replay?"
|
||||||
|
f"continuation={continuation}&pbj=1")
|
||||||
|
for _ in range(MAX_RETRY + 1):
|
||||||
|
with session.get(url ,headers = headers) as resp:
|
||||||
|
try:
|
||||||
|
text = resp.text
|
||||||
|
status_code = resp.status_code
|
||||||
|
livechat_json = json.loads(text)
|
||||||
|
break
|
||||||
|
except json.JSONDecodeError :
|
||||||
|
time.sleep(1)
|
||||||
|
continue
|
||||||
|
else:
|
||||||
|
logger.error(f"[{self.video_id}]"
|
||||||
|
f"Exceeded retry count. status_code={status_code}")
|
||||||
|
return None
|
||||||
|
return livechat_json
|
||||||
|
|
||||||
|
def _callback_loop(self,callback):
|
||||||
|
""" コンストラクタでcallbackを指定している場合、バックグラウンドで
|
||||||
|
callbackに指定された関数に一定間隔でチャットデータを投げる。
|
||||||
|
|
||||||
|
Parameter
|
||||||
|
---------
|
||||||
|
callback : func
|
||||||
|
加工済みのチャットデータを渡す先の関数。
|
||||||
|
"""
|
||||||
|
while self.is_alive():
|
||||||
|
items = self._buffer.get()
|
||||||
|
data = self.processor.process(items)
|
||||||
|
callback(data)
|
||||||
|
|
||||||
|
def get(self):
|
||||||
|
""" bufferからデータを取り出し、processorに投げ、
|
||||||
|
加工済みのチャットデータを返す。
|
||||||
|
|
||||||
|
Returns
|
||||||
|
: Processorによって加工されたチャットデータ
|
||||||
|
"""
|
||||||
|
if self._callback is None:
|
||||||
|
items = self._buffer.get()
|
||||||
|
return self.processor.process(items)
|
||||||
|
raise IllegalFunctionCall(
|
||||||
|
"既にcallbackを登録済みのため、get()は実行できません。")
|
||||||
|
|
||||||
|
def is_alive(self):
|
||||||
|
return self._is_alive
|
||||||
|
|
||||||
|
def finish(self,sender):
|
||||||
|
'''Listener終了時のコールバック'''
|
||||||
|
try:
|
||||||
|
self.terminate()
|
||||||
|
except CancelledError:
|
||||||
|
logger.debug(f'[{self.video_id}]cancelled:{sender}')
|
||||||
|
|
||||||
|
def terminate(self):
|
||||||
|
'''
|
||||||
|
Listenerを終了する。
|
||||||
|
'''
|
||||||
|
self._is_alive = False
|
||||||
|
if self._direct_mode == False:
|
||||||
|
#bufferにダミーオブジェクトを入れてis_alive()を判定させる
|
||||||
|
self._buffer.put({'chatdata':'','timeout':1})
|
||||||
|
logger.info(f'終了しました:[{self.video_id}]')
|
||||||
|
|
||||||
|
@classmethod
|
||||||
|
def shutdown(cls, event, sig = None, handler=None):
|
||||||
|
logger.debug("シャットダウンしています")
|
||||||
|
for t in ReplayChat._listeners:
|
||||||
|
t._is_alive = False
|
||||||
57
pytchat/core_multithread/replayparser.py
Normal file
57
pytchat/core_multithread/replayparser.py
Normal file
@@ -0,0 +1,57 @@
|
|||||||
|
import json
|
||||||
|
from .. import config
|
||||||
|
from .. import mylogger
|
||||||
|
from .. exceptions import (
|
||||||
|
ResponseContextError,
|
||||||
|
NoContentsException,
|
||||||
|
NoContinuationsException )
|
||||||
|
|
||||||
|
|
||||||
|
logger = mylogger.get_logger(__name__,mode=config.LOGGER_MODE)
|
||||||
|
|
||||||
|
|
||||||
|
class Parser:
|
||||||
|
def parse(self, jsn):
|
||||||
|
#print(jsn)
|
||||||
|
if jsn is None:
|
||||||
|
return {'timeoutMs':0,'continuation':None},[]
|
||||||
|
if jsn['response']['responseContext'].get('errors'):
|
||||||
|
raise ResponseContextError('動画に接続できません。'
|
||||||
|
'動画IDが間違っているか、動画が削除/非公開の可能性があります。')
|
||||||
|
contents=jsn['response'].get('continuationContents')
|
||||||
|
#配信が終了した場合、もしくはチャットデータが取得できない場合
|
||||||
|
if contents is None:
|
||||||
|
raise NoContentsException('チャットデータを取得できませんでした。')
|
||||||
|
|
||||||
|
cont = contents['liveChatContinuation']['continuations'][0]
|
||||||
|
if cont is None:
|
||||||
|
raise NoContinuationsException('Continuationがありません。')
|
||||||
|
metadata = cont.get('liveChatReplayContinuationData')
|
||||||
|
if metadata is None:
|
||||||
|
unknown = list(cont.keys())[0]
|
||||||
|
if unknown:
|
||||||
|
metadata = cont.get(unknown)
|
||||||
|
|
||||||
|
actions = contents['liveChatContinuation'].get('actions')
|
||||||
|
interval = self.get_interval(actions)
|
||||||
|
metadata.setdefault("timeoutMs",interval)
|
||||||
|
print(metadata["continuation"])
|
||||||
|
|
||||||
|
chatdata = []
|
||||||
|
for action in actions:
|
||||||
|
chatdata.append(action["replayChatItemAction"]["actions"][0])
|
||||||
|
#print(chatdata)
|
||||||
|
return metadata, chatdata
|
||||||
|
|
||||||
|
def get_interval(self, actions: list):
|
||||||
|
if actions is None:
|
||||||
|
return 0
|
||||||
|
start = int(actions[0]["replayChatItemAction"]["videoOffsetTimeMsec"])
|
||||||
|
last = int(actions[-1]["replayChatItemAction"]["videoOffsetTimeMsec"])
|
||||||
|
print((last - start)/1000)
|
||||||
|
if (last - start) > 60*20*1000:
|
||||||
|
return 60000
|
||||||
|
return (last - start)
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
@@ -10,7 +10,7 @@ def test_arcparam_0(mocker):
|
|||||||
|
|
||||||
|
|
||||||
def test_arcparam_1(mocker):
|
def test_arcparam_1(mocker):
|
||||||
param = arcparam.get("01234567890", pos = 100000)
|
param = arcparam.get("01234567890", seektime = 100000)
|
||||||
assert "op2w0wR3GjxDZzhhRFFvTE1ERXlNelExTmpjNE9UQWFFLXFvM2JrQkRRb0xNREV5TXpRMU5qYzRPVEFnQVElM0QlM0QogNDbw_QCMAA4AEAASANSHAgAEAAYACAAKg5zdGF0aWNjaGVja3N1bUAAWANgAWgAcgQIARAAeAA%3D" == param
|
assert "op2w0wR3GjxDZzhhRFFvTE1ERXlNelExTmpjNE9UQWFFLXFvM2JrQkRRb0xNREV5TXpRMU5qYzRPVEFnQVElM0QlM0QogNDbw_QCMAA4AEAASANSHAgAEAAYACAAKg5zdGF0aWNjaGVja3N1bUAAWANgAWgAcgQIARAAeAA%3D" == param
|
||||||
|
|
||||||
def test_arcparam_2(mocker):
|
def test_arcparam_2(mocker):
|
||||||
@@ -19,7 +19,7 @@ def test_arcparam_2(mocker):
|
|||||||
resp = requests.Session().get(url,headers = config.headers)
|
resp = requests.Session().get(url,headers = config.headers)
|
||||||
jsn = json.loads(resp.text)
|
jsn = json.loads(resp.text)
|
||||||
parser = Parser()
|
parser = Parser()
|
||||||
metadata , chatdata = parser.parse(jsn)
|
_ , chatdata = parser.parse(jsn)
|
||||||
test_id = chatdata[0]["replayChatItemAction"]["actions"][0]["addChatItemAction"]["item"]["liveChatTextMessageRenderer"]["id"]
|
test_id = chatdata[0]["replayChatItemAction"]["actions"][0]["addChatItemAction"]["item"]["liveChatTextMessageRenderer"]["id"]
|
||||||
print(test_id)
|
print(test_id)
|
||||||
assert "CjoKGkNMYXBzZTdudHVVQ0Zjc0IxZ0FkTnFnQjVREhxDSnlBNHV2bnR1VUNGV0dnd2dvZDd3NE5aZy0w" == test_id
|
assert "CjoKGkNMYXBzZTdudHVVQ0Zjc0IxZ0FkTnFnQjVREhxDSnlBNHV2bnR1VUNGV0dnd2dvZDd3NE5aZy0w" == test_id
|
||||||
|
|||||||
3104
tests/testdata/chatreplay.json
vendored
Normal file
3104
tests/testdata/chatreplay.json
vendored
Normal file
File diff suppressed because it is too large
Load Diff
Reference in New Issue
Block a user