YTM:一键搞定 YouTube 字幕,还带时间戳,太好用了!
Invalid Date
刷 YouTube 时有没有这种烦恼:视频里一句金句想记下来,却得暂停、拖进度条、手动抄,累得不行?
今天要给大家推荐一个神器——YouTube Transcripts Machine(简称 YTM)。它能一键提取任何 YouTube 视频的字幕,带上精准时间戳,还能点击跳转到对应位置,甚至直接导出全文。
简单实用,效率党看了都想喊“真香”!接下来,我带你看看它怎么用,能干啥,以及背后的原理。
想象你在看教程视频,讲师讲到关键点,想记下来却找不准时间;或者你是内容创作者,要从访谈里抓素材,手动记时间太崩溃。
YTM 就是为这些场景设计的。把视频链接一扔,几秒钟就给你整出带时间戳的字幕,省时省力,谁用谁知道。
操作简单到飞起,几秒出结果
用 YTM 完全没门槛。
打开它的网页(或本地跑起来),把 YouTube 视频链接粘贴到输入框,点一下,几秒后你就看到一个干净的页面:完整字幕列出来,每句旁都有时间戳。
想重温某段?点时间戳直接跳过去。想保存?一键复制到剪贴板,或者下载成文本文件。
电脑手机都好使,界面简单又顺手。
比如我最近整理一个 TED 演讲笔记,20 分钟视频,以前手抄加找时间得一小时。用 YTM 后,链接一丢,10 秒出全文,重点部分点时间戳确认,半小时搞定,还导出一份存档。效率直接起飞,用过一次就回不去了。
它咋做到的?技术其实不复杂
YTM 怎么这么聪明?简单说,它用了个叫 Stagehand 的工具,像虚拟助手一样,自动打开 YouTube 视频,点开字幕面板,把内容和时间戳抓下来,再整理成你看到的列表。具体流程是:你输入链接,它通过 Stagehand 跑一个浏览器会话,去视频页面打开字幕,提取数据,然后用 OpenAI 的 GPT 模型(默认 GPT-4o Mini)处理一下,确保准确。
云端跑的 BrowserBase 负责执行,整个过程你啥也不用管。
对用户来说,这就跟魔法一样——复制粘贴链接,等着看结果就行。唯一前提是视频得有字幕(YouTube 自动生成的那种也行),不然它也没辙。
用它干啥?这些场景超实用
YTM 能帮你解决啥问题?咱们从实际场景聊聊。
学习党会爱上它。比如看英文教学视频,想整理例句做单词卡,YTM 直接给你字幕和时间戳,复制编辑就行。专业课程也一样,公式步骤啥的,点时间戳快速定位,不用瞎拖进度条。
内容创作者也能省事儿。比如你是 UP 主,从采访视频挑金句剪辑,YTM 抓出对话带时间戳,剪辑时直接跳过去,比手记快多了。写文章引用数据,导出文本一搜关键词,效率翻倍。
职场人士开会录像整理重点也行。视频传到 YouTube,丢链接进去,几分钟出记录,谁啥时候说了啥一目了然。
自己试试?安装超简单
想本地跑 YTM,很容易。需要 Node.js 和 npm(基础环境,网上教程一堆),还有 OpenAI 和 BrowserBase 的 API 密钥(去官网申请)。然后照着步骤来:
# 克隆仓库
git clone https://github.com/zaidmukaddam/youtube-transcripts-machine.git
cd youtube-transcripts-machine
# 安装依赖
npm install
复制 .example.env
成 .env.local
,填入密钥:
OPENAI_API_KEY=你的_openai_api_key
BROWSERBASE_API_KEY=你的_browserbase_api_key
BROWSERBASE_PROJECT_ID=你的_project_id
跑 npm run dev
,浏览器打开 localhost:3000
就能用。想换 Anthropic 的 Claude 模型?加个 ANTHROPIC_API_KEY
,改下 stagehand.config.ts
的模型名就行。
上线更简单,用 Vercel 点一下部署按钮,配置好变量,几分钟搞定。
小提醒
YTM 很顺手,但视频得有字幕,不然没戏。API 密钥得自己弄,虽然不贵,但要花点时间申请。
最后说两句
YouTube Transcripts Machine 是个效率神器,简单实用,特别适合需要处理视频内容的人。学习、创作、工作都能用得上,省下的时间拿去干啥不好?试试看吧,下次刷视频有它帮忙,绝对事半功倍。
项目仓库链接:https://github.com/zaidmukaddam/youtube-transcripts-machine.git