明るく

暗く

AI

【学生向け】 Google AI Studio の文字起こしの基本│すぐにできる方法を解説

2025.11.20

2025.11.29

【学生向け】 Google AI Studio の文字起こしの基本│すぐにできる方法を解説

「YouTubeの内容をAIで手軽に要約したい」

「音声や動画のデータを無料でできるAIツールを見つけたい」

こんなお悩みありませんか?

 

音声や動画のデータ、YouTubeを文字起こしするなら、Google AI Studioがおすすめです。Google AI Studioとは最新のGeminを無料で試せるWebツールで、以下のことができます。

 

  • 文章作成
  • 文章要約
  • 翻訳
  • 文字起こし
  • 画像生成

 

本記事では、Google AI Studioの使用方法を文字起こしに絞って、実際の使用手順やプロンプトから使用時の注意点やトラブル解決法まで幅広く解説します。

 

Google AI Studioを活用して音声・動画の文字起こしを自動化することで、学習ノートやレポート作成の時間を短縮できます。ぜひ、最後までご覧ください。

無料で文字起こしするならGeminiよりもGoogle AI Studioがおすすめ│表で比較

動画や音声ファイルの長さが数分程度の場合はGeminiでも対応可能です。しかし、10分以上の長さになる場合はGoogle AI Studioがおすすめです。

 

文字起こしに関する性能について、Google AI Studio と Gemini を比較した結果を以下の表にまとめました。

 

項目

Google AI Studio(無料) Gemini アプリ(無料)
選べるモデル Gemini 3 Pro / Gemini 3 Flash など Gemini 3 Flash
レート制限(回数・スピード)
  • Gemini 3 Flash:15回/分・1,500回/日までリクエストが可能
  • Gemini 3 Pro:2回/分・50回/日までリクエストが可能
プロンプトの長さ・アップロードしたファイルサイズなどによって使用量が制限、リセットされるまで一定期間待つ必要がある
実務の安定性
  • 中~長時間の音声・動画ファイル、または何本も文字起こしする場合に向く
  • エラーが出にくく、処理が完遂しやすい
  • 短~中時間の音声・動画ファイルの気軽な文字起こしに向く
  • あまりに長い出力は途中で止まることがある(「続きを生成」が必要)
音声の最大長
(1回のリクエスト)
最大 約9.5時間 1回あたりのアップロード制限

  • 音声ファイル:合計 10 分
  • 動画ファイル:合計 5 分
アップロード上限
  • 1ファイル最大2GB
  • YouTube 動画は1日最大8 時間
  • 最大10ファイルを同時にアップロード可能
  • 音声:1ファイル最大100MB
  • 動画:1ファイル最大2GB
文字起こし対象の渡し方
  • 音声/動画ファイルをアップロード
  • YouTubeのURLを入力
  • Googleドライブ内のファイルを選択
  • 音声/動画ファイルをアップロード
  • YouTubeのURLを入力
  • Googleドライブ内のファイルを選択
向いている使い方
  • 長時間の講義やセミナーの内容を正確に文字起こしする
  • 文字起こし内容をもとにノート作成や整形などの作業も自動化する
  • 「この動画のここからここまで」と細かく指示する
  • 面接や授業の一部(約10分)をすぐに文字起こしして、要点をまとめる
  • 授業やニュース動画(数分)を簡単に要約する
  • スマホで録音した短い音声メモをテキスト化する

※表の内容は2025年11月末現在

Google AI Studioを使った文字起こしの手順

Google AI Studioで文字起こしを行うステップは以下の通りです。

  1. ファイルやURLを準備する
  2. Google AI Studioにログインする
  3. プロジェクトを新規作成してモデルを選択する
  4. ファイルをアップロードまたはURLを入力する
  5. プロンプトで文字起こしと整形を指示する
  6. 完成品をコピーしてGoogle Documentなどに保存する

それぞれのステップについて、詳しく見ていきましょう。(2025年11月末現在)

 

(1)ファイルやURLを準備する

Google AI Studioのアップロードに対応しているファイルを準備します。

ファイル種類

対応している形式

音声
  • MP3
  • WAV
  • FLAC
  • OGG
  • AAC
動画
  • MP4
  • AVI
  • MOV
  • WebM
  • MPEG
  • WMV
  • 3GPP
画像
  • PNG
  • JPEG
  • WebP

※表の内容は2025年11月末現在

 

アップロードするファイルサイズには2GBの制限があります。ファイルサイズが大きい場合は「ファイルを分割する」「無音部分をカットする」「WAV → FLACなどサイズの軽い拡張子へ変換する」ことで容量を抑えましょう。

 

(2)Google AI Studioにログインする

Google AI Studioにログインして、ホーム画面を開きます。

 

1. https://aistudio.google.com/にアクセスし、「Get Started」を押す

 

Google AI Studioを開始する

 

2. 自身のGoogleアカウントでログインする

 

Googleアカウントでログインする

 

3. 「Try Gemini」を選択する
※ログイン済みの状態で Google AI Studioを開くなど、以下が表示されない場合は4. へ進みましょう。

 

Try Geminiを選択する

 

4.Google AI Studio のホーム画面に到着。この画面で文字起こしをしていきます。

 

(3)プロジェクトを新規作成してモデルを選択する

1. 右上のメニューをクリックします。

 

Google AI Studioのモデル選択をする

 

2.「Model selection」でAIモデルを選択します。

 

Model selectionでモデルを選択する

 

文字起こしをするときは、Gemini 3 Pro または Gemini 3 Flashがおすすめです(2025年11月末現在)。以下の表を参考に、処理速度と精度のどちらを重視するかで、用途にあったモデルを選択しましょう。

 

  Gemini 3 Flash Gemini 3 Pro
特徴 処理が速く、たくさんのファイルを素早く片付けるのに適している 難しい内容を正確に理解し、高度な分析が得意なモデル
メリット

文字起こしのスピードが非常に速い

  • ノイズがある音声や専門用語も高精度で文字起こしできる
  • 文脈をしっかり理解した 要約ができる
デメリット 音質が悪いファイルや、話が複雑なときの理解力はProに劣る
  • 処理に時間がかかる
  • 大量の処理には向かない
向いている使い方
  • 短いファイルや音質の良いファイルをたくさん処理したい

  • 速さを重視したい

  • 長いファイルや専門用語が多い、雑音が入ったファイルを処理したい

  • 文字起こしと一緒に、内容の深い分析や要約を頼みたい

※Google AI Studio (無料)範囲内、2025年11月末現在

 

3. チャットの内容を保存したり履歴に残したくなかったりする場合は、画面右上のメガネマークをクリックして「Temporay chat」モードに変更します。

テンポラリーモードをオンにする

 

「Temporay chat」モードは、以下の点が通常モードと異なります。

 

  • チャットの途中で通常モードに変更できない
  • ブラウザの画面をリロードしたり他のページに変えたりすると、チャットのやりとりが消える
  • チャットの内容が保存されない(ただし、アップロードしたファイルは自身のGoogle Driveの「Google AI Studio」フォルダに保存される)

(4)ファイルをアップロードまたはURLを入力する

(1) で準備したファイルやURLを、Google AI Studioに読み込ませます。

 

● ファイルをアップロードする場合

チャットボックスの+ボタンから「Upload File」をクリックし、該当フォルダを選択します。

Google AI Studioでファイルをアップロードする

 

ファイルが手元にある場合は、チャットボックスに直接ドラッグ&ドロップでも
アップロードが可能です。

 

Google AI Studioにてドラッグ&ドロップでアップロードする

 

● URLを入力する場合

YouTubeは、チャットボックスに直接URLを入力する、もしくは+ボタンから「YouTube Video」をクリックしてURLを入力します。

 

Google AI StudioにてYouTubeのURLを入力する

 

+ボタンから入力すると、動画の開始時間と終了時間の指定が可能です。

 

Google AI StudioにてYouTubeアップロードの詳細を指定する

 

再生時間が長くてうまく読み込めなかったりエラーが起こったりする場合は、動画を複数回に分けて文字起こしをしましょう。

 

またYouTubeの文字起こしには、著作権や使用許諾といった注意点があります。後述するので、詳しくはそちらを確認してください。

(5)プロンプトで文字起こしと整形を指示する

1.チャットボックスに「添付したファイル(URL)を一言一句正確に文字起こしをしてください」と入力する

 

2.「Run」ボタンをクリックする

 

Google AI Studioのチャットにテキスト・ファイルを入力する
3.Google AI Studioの初回使用時には、Google Driveへの接続メッセージが表示されます。クリックしてそのまま進めましょう。

 

Google AI Studioにおける初回チャット時の注意点

 

これでチャットの内容は、Google Driveの「Google AI Studio」フォルダに自動保存されるようになります。

 

GoogleドライブのGoogle AI Studioフォルダに保存される

 

また、通常モードで文字起こしを行った場合は、画面左の「View all history」から履歴を確認できます。

 

Google AI Studioのチャット履歴

 

4.出来上がった文字起こしから、さらに内容を要約したり他言語に翻訳したりする場合は、続けてプロンプトで依頼します。具体的なプロンプトはこの後解説していますので、そちらをご覧ください。

(6)完成品をコピーしてGoogle Documentなどに保存する

文字起こしが完成したら、コピーしてGoogle Documentなどに貼り付けましょう。

 

文字起こしの精度は100%正確ではなく、専門用語や固有名詞の間違い、誤字・脱字があります。そのため、完成品を自分の目で確認・修正してから使うようにしましょう。

そのまま使える文字起こし後のプロンプト例│整形・要約・翻訳

手順(5)-4で使える、文字起こしした内容を要約・翻訳・整形するためのプロンプト例を紹介します。

講義のノート化

文字起こしを講義ノートの形式で整理するプロンプトです。以下のステップで順に行ってください。

 

(1)基本のプロンプト

次の文字起こしを、講義ノートの形式で整理してください。
 
出力フォーマット:
1. 要点(3〜5点)
2. 重要用語(箇条書き)
3. 例(講師が挙げた具体例)
4. 宿題や課題(もし言及があれば)
 
入力文:
【ここに文字起こしを貼り付け】

 

(2)不足の補完

上記の講義ノートに不足があれば補完してください。
特に、重要な概念が省かれていないか確認し、必要なら追記してください。

 

(3)表形式に変換

講義ノートの「要点」と「重要用語」を表にまとめ直してください。
列は「要点/関連用語/説明」にしてください。

 

(4)引用の抽出

講義の中から講師が強調した言葉や印象的なフレーズを抜き出してください。
元の文を引用として提示し、簡単な解説を1行添えてください。

要点の抽出

文字起こしから要点を抽出するためのプロンプトです。

 

次の文字起こしを整理してください。
 
1. 要点を5点で要約
2. 講義のキーワード(5〜10語)
3. 内容理解を確認する質問を3問作成(選択肢不要)
 
入力文:
【ここに文字起こしを貼り付け】

引用の抽出

文字起こしから、強調されていた言葉や印象的なフレーズを抽出するプロンプトです。

 

次の文字起こしから、講師が強調した言葉や印象的なフレーズを抜き出してください。
 
出力形式:
– 引用文(原文そのまま)
– 出典やタイムメモ(わかる範囲で)
– 補足説明(1文)
 
入力文:
【ここに文字起こしを貼り付け】

英語 → 日本語の要約(英語と日本語の混在会話の場合)

文字起こしに複数の言語が混在している場合の、要約プロンプトです。

 

次の文字起こしを整理してください。
 
– 英語発言は日本語に要約
– 日本語発言はそのまま簡潔にまとめる
– 出力形式は「要点リスト(番号付き)」
 
入力文:
【ここに文字起こしを貼り付け】

文字起こし → 要約 → 整形

文字起こし・要約・整形のプロンプトです。以下のステップで順に行ってください。

 

1.文字起こし

次の音声をそのまま文字に起こしてください。

 

2.要約

上記の文字起こしを、講義の要点5点でまとめてください。

 

3.整形

要約を講義ノート形式に整えてください。
 
形式:
1. 要点
2. 重要用語
3. 例
4. 宿題や課題

 

ここまでで、Google AI Studio を使った文字起こしの流れや、実際のプロンプトの使い方がイメージできたのではないでしょうか。

 

Google AI Studioで講座等の音声や動画を文字起こしするときには、事前に知っておくべき注意点があります。文字起こし前に把握しておかないとトラブルに繋がる恐れがあるので、この後詳しく紹介していきます。

注意点

Google AI Studioを始めとする生成AIでの文字起こしは、必ずしも100%正確ではなく、自分の目で確認することが必要です。

 

また、機密情報のアップロードや著作権・使用許諾の未確認はトラブルの原因となります。使用する音声や動画などの素材にも、十分注意しましょう。

文字起こしの精度は100%正確ではない

「ファイルの音質が良くない」「複数の話者が登場する」「固有名詞や業界用語が多い」などの影響でAIが音声を正確に認識できず、正しく文字起こしできないことがあります。

 

文字起こしのテキストは出来上がったままで使わないようにし、元のファイルと照らし合わせて間違いがないかを目視で確認しましょう。高い精度で文字起こしをしたい場合は、選択可能な最上位モデルを使いましょう。

機密情報はアップロードしない

Google AI Studioにアップロードした音声や動画、AIの回答は、Temporary chatモードであっても、品質改善や開発に活用される可能性があります。特に無料プランでは、その可能性が高まります。

 

そのため、個人情報や機密情報が入ったファイルはアップロードしないことが重要です。どうしてもアップロードしたい場合は、個人情報や機密情報が入っていない部分だけを切り取って文字起こしするか、音声や動画ファイルを編集してから行いましょう。

素材を利用する前に著作権や使用許諾を確認する

YouTubeをはじめとする音声や動画は、多くの場合、投稿者が著作権などの権利を持っています。そのため、許可なく内容を文字起こしして共有すると、思わぬトラブルにつながる可能性があります。

 

また、配信者が「無断転載不可」などのルールを設けていることもあります。利用前に概要欄や利用規約で、使用が許可されているかどうかを確認しましょう。

学内規程を守る

講義の音声や動画をGoogle AI Studioにアップロードしていいか、文字起こししたものを使っていいか、事前に学内の規程を確認しておきましょう。

 

例えば、「AIが生成した内容を流用したレポートが盗用と見なされる」「研究データなどを無断でアップロードしてセキュリティポリシーに違反する」などのリスクがあります。

わからない場合は授業の担当教員や教務課、オンライン授業や学習システムの管理部署などに確認しましょう。

Google AI Studioでの文字起こしに関するよくある質問

Google AI Studioで文字起こしをする際の、よくある疑問とその解決方法を紹介します。

Q1:途中で処理が止まる/失敗するのはなぜ?

原因ごとに当てはまる対処法を試してみてください。

原因

具体例

効果的な対処法

ファイルサイズが大きい
  • ファイルサイズが2GBを超える
  • WAVやMOVなどファイルサイズの重い拡張子を使用している
  • ファイルを分割してアップロードする
  • 無音部分やフィラーの箇所を削除する
  • 公式にサポートされている形式(音声はFLACやMP3など、動画はMP4など)に変換
YouTubeの再生時間が長い YouTubeの再生時間が30分を超える 再生時間の範囲を指定・分割してアップロードする
形式・エンコード不適合
  • 一部のスマートフォンで録音されるM4Aファイル
  • 特殊なコーデックで圧縮されている動画
  • サンプリングレートが極端に低い音声
  • 音声:MP3(128–192kbps)やFLACへ変換、極端に品質が悪いならWAVに変換する
  • 動画:MP4(video/mp4)やWebMへ変換する
ネットワーク不安定
  • Wi-Fiが頻繁に途切れる
  • 大容量ファイルのアップロードが完了しない
  • 安定した回線に切り替える
  • ファイルを再アップロードする
  • ブラウザのシークレットモードで再試行する
  • 複数のブラウザを立ち上げたりGoogleアカウントで複数ログインしたりしている場合、すべて閉じて、使用するブラウザのみで再試行する
モデル負荷 進捗バーが進まずにタイムアウトが発生する
  • 3 Flashなどの軽量モデルへ切り替える
  • 一回にアップロードするファイルサイズやテキスト量を少なくする
プロンプトをまとめすぎている 文字起こし+要約+整形など、複数のタスクを一度に依頼 1プロンプト=1目的にして、複数回に分けて依頼する

Q2:動画やYouTubeも文字起こしできる?

動画ファイルのアップロード、YouTubeのURL入力両方で文字起こしが可能です。

 

しかし、第三者が作成した動画を無断で文字起こしをして、自身のレポートや論文に利用することは、著作権を侵害する恐れがあります。

 

著作権を侵害しないために、以下のようなケースに限って利用するようにしましょう。

 

  • 自分で撮影・編集してアップロードした動画
  • クリエイティブ・コモンズなど、再利用が許可されているライセンスの動画
  • 著作権者から直接、文字起こしを行う許可を得た動画

Q3:どのモデルを選べばいい?

基本的には処理速度と精度のバランスが取れた Gemini 3 Flashを選びましょう。

「Gemini 3 Flashでは精度が不十分」「固有名詞が多い・複数言語が混在するなど内容が複雑」など、高い精度が求められるケースでは、Gemini 3 Pro がおすすめです。

 

※モデル表記は2025年11月末現在

Q4:文字起こしや整形が思った感じにならないときはどうするといい?

文字起こしや整形がうまくいかないときは、以下を試してみてください。

 

1.事前に固有名詞や専門用語の情報を与える

複雑な固有名詞や専門用語は、文字起こしのプロンプトで一緒に入力しておくと、誤りが少なくなります。「登場人物:山田さん・Michaelさん」「固有名詞:Google AI Studio」のように入力しましょう。

 

2.先に出力するフォーマットを指定する

出力フォーマットを先に指定しておくと、整形ズレが少なくなります。レポート作成やデータ整理など、自分の目的に合わせて「形式:話者Aさん:(発言内容)→ 話者Bさん:(発言内容)」「出力フォーマット:Excel」のようにプロンプトで入力しましょう。

 

3.複数回にわけてプロンプトで指示をする

一回のプロンプトで複数の依頼を入力すると、生成される内容の精度が下がる可能性があります。「ファイルを文字起こし」→「文字起こし内容の要点を3つにまとめる」→「要点をExcelに貼り付けできる形式にする」のように、複数回に分けて依頼しましょう。

まとめ:Google AI Studioの文字起こしを安全に活用してみよう

Google AI Studioを使うと、講義や動画などの音声を簡単に文字起こしできます。 一方で、モデルの選定やプロンプト、情報セキュリティ、著作権など、いくつか注意の必要なポイントもあります。

 

本記事で紹介した使い方や注意点を押さえながら、Google AI Studioの文字起こしを安全に、そして自分に合う形で活用していきましょう。