[파이썬] 유튜브 자막 가져오기

728x90

from youtube_transcript_api import YouTubeTranscriptApi

def get_youtube_transcript(video_id):
    """
    유튜브 동영상 ID를 받아 자막을 추출하는 함수

    Args:
        video_id (str): 유튜브 동영상 ID

    Returns:
        list: 자막 데이터 리스트
    """

    try:
        # 지정된 언어로 자막 추출 (여기서는 한국어)
        transcript_list = YouTubeTranscriptApi.get_transcript(video_id, languages=['ko'])

        return transcript_list
    except Exception as e:
        print(f"자막 추출 오류: {e}")
        return None

# 유튜브 동영상 ID 입력
video_id = "gOmqbkB2f-w"  # 여기에 실제 동영상 ID를 입력하세요

# 자막 추출
transcript = get_youtube_transcript(video_id)

# 추출된 자막 출력 (예시)
# if transcript:
#     for item in transcript:
#         print(f"시간: {item['start']} ~ {item['duration']}, 텍스트: {item['text']}")
# else:
#     print("자막을 찾을 수 없습니다.")

# 시간 부분을 제거하고 텍스트만 출력
for item in transcript:
    # "텍스트:" 이후 부분만 추출
    text = item['text']
    print(text)

728x90

'프로그램' 카테고리의 다른 글

[딥러닝] 지도학습 후 강화학습 (DeepSeek 알고리즘) (0)	2025.02.04
[파이썬] png 파일로 동영상 만들기 (0)	2024.10.15
[파이썬] 문제 : 데이터에서 특정 데이터가 있으면 변경하기 (0)	2024.07.31
[파이썬] 문제 : 이미지의 영역의 RGB값 평균 (0)	2024.07.28
[파이썬] OpenGL의 3D 사각형을 시점 바꾸기 (2)	2024.07.14

물음과 깨달음

[파이썬] 유튜브 자막 가져오기

'프로그램' 카테고리의 다른 글

댓글

티스토리툴바

[파이썬] 유튜브 자막 가져오기

'프로그램' 카테고리의 다른 글

관련글

댓글

티스토리툴바