본문 바로가기
프로그램

[파이썬] 유튜브 자막 가져오기

by 오디세이99 2024. 10. 24.
728x90
반응형
from youtube_transcript_api import YouTubeTranscriptApi

def get_youtube_transcript(video_id):
    """
    유튜브 동영상 ID를 받아 자막을 추출하는 함수

    Args:
        video_id (str): 유튜브 동영상 ID

    Returns:
        list: 자막 데이터 리스트
    """

    try:
        # 지정된 언어로 자막 추출 (여기서는 한국어)
        transcript_list = YouTubeTranscriptApi.get_transcript(video_id, languages=['ko'])

        return transcript_list
    except Exception as e:
        print(f"자막 추출 오류: {e}")
        return None

# 유튜브 동영상 ID 입력
video_id = "gOmqbkB2f-w"  # 여기에 실제 동영상 ID를 입력하세요

# 자막 추출
transcript = get_youtube_transcript(video_id)

# 추출된 자막 출력 (예시)
# if transcript:
#     for item in transcript:
#         print(f"시간: {item['start']} ~ {item['duration']}, 텍스트: {item['text']}")
# else:
#     print("자막을 찾을 수 없습니다.")

# 시간 부분을 제거하고 텍스트만 출력
for item in transcript:
    # "텍스트:" 이후 부분만 추출
    text = item['text']
    print(text)
728x90
반응형

댓글