探索 Google AI Studio：免费且强大的 AI 工具

技术文章 6月 22, 2025

你想知道目前最好用的 AI 工具是什么吗？我会毫不犹豫地推荐 Google AI Studio。这款产品不仅几乎免费，更搭载了当前排名第一的 Gemini 2.5 Pro 模型。你没听错，它既免费又是市面上最强大的 AI 产品，这简直令人难以置信！

它能做什么？只需一句话，它就能生成电影级别的视频片段；它能实时共享你的屏幕，手把手教你解决电脑问题；它甚至能创作出专业级别的音乐。

这篇指南将带你全面了解 Google AI Studio，无论你是 AI 小白还是经验丰富的用户，都能轻松掌握这款强大的生产力工具。

Google AI Studio 与 Gemini App 的区别

或许你会问，既然有用户界面更友好的 Gemini App，为什么还要选择 Google AI Studio 呢？虽然两者都搭载了顶级的 Gemini 2.5 Pro 模型，但它们之间存在显著差异：

Google AI Studio：专为开发者和 AI 创作者设计，需要一些探索精神。它能对问题进行更深入、更专业的分析。
Gemini App：面向普通用户，几乎没有技术门槛，开箱即用。它的回答通常更简洁，有时甚至会显得过于迎合。

如果你真的想利用 AI 提升工作效率，我强烈建议你直接上手 Google AI Studio。尽管界面稍显复杂，但只要跟着本指南一步步操作，你就能彻底掌握它的使用方法，从而显著提升效率。

小贴士： 我强烈建议你在每次看完案例示范后，暂停视频并亲自操作一遍，这是最快掌握 AI 技能的方法。

Google AI Studio 入门：设置与基础功能

现在，你可以在浏览器中搜索 Google AI Studio。中国用户请记得开启“魔法”并设置成美国全局模式。登录你的 Google 账号后，你将进入 Google AI Studio 的界面。初次接触可能会觉得有点复杂，但这很正常，熟悉之后就会觉得非常简单。

个性化设置：

沉浸式翻译插件： 我建议你安装一个沉浸式翻译插件，这样即使英文不好，也能轻松将界面翻译成中文，让语言不再是障碍。
AI 聊天窗口： 界面中间是 AI 的聊天窗口，使用起来和普通的聊天软件一样简单。
右侧设置选项： 右侧有很多设置选项，看起来复杂，但我们只需关注最重要的三个。

核心模型与参数：

将鼠标悬停在模型名称上，你将看到当前选择模型的详细信息。我们今天主要使用的是 Google 最新发布的旗舰模型 Gemini 2.5 Pro。

数据统计（Token 统计）： Token 是 AI 理解语言的基本单位，你可以简单理解为它在计算你与 AI 交互时所消耗的资源量。Gemini 2.5 Pro 作为谷歌最新最强的模型，拥有顶级的思考和推理能力，反应更快、效率更高。谷歌提供的免费套餐非常慷慨，对于个人正常使用和学习来说绰绰有余，你完全不用担心免费额度的问题。
温度（Temperature）： 你可以将其理解为 AI 回答的创造力和想象力。
- 设置为 0：回答可能非常严谨、死板。
- 设置为 2：回答可能天马行空、充满创意。
- 我通常保持默认值 1：回答既不死板也不会过于跳跃，恰到好处。
高级设置： 除非你是程序员，否则这些高级设置都可以保持默认，完全不影响使用。

AI 聊天功能实操与技巧

现在，我们来实际操作一下，让 AI 帮助我们整理最近一周的 AI 热点新闻。

01. 提问小技巧：结构化提示词

我分享一个提问小技巧：使用结构化的提示词，输出的内容会非常准确。就像这样，将你的需求拆分成几个方面：目的、时间、范围、输出的格式。其实这并不难，你模仿几次就会有感觉了。

02. 获取最新资讯：打开谷歌搜索开关

点击运行后，你可能会发现 AI 给出的答案是旧数据。解决这个问题很简单，来到右侧，把谷歌搜索的开关打开。如果你不想要旧的答案，想让它重新生成，操作也很简单：将鼠标放在回答上，看到 Gemini 的图标后点击一下，它就能联网搜索并为你生成最新的内容。你看，这次的内容就是最新的了！

03. 系统提示词：强制中文回复

用久了之后，你会发现它有时会突然回复英文，体验很不好。我建议你使用系统提示词，强制它只说中文。点击这里的系统提示词，告诉它你必须用简体中文进行回复。设置好后将其折叠起来就行了，这样在这个聊天窗口里面，它就不会再乱飙英文了。虽然换新的窗口需要重新设置，但这是一个非常有效的小技巧。

04. 保存记录与自动保存

如果觉得这次的聊天内容很有用，一定要点击右上角的保存，否则 Google AI Studio 是不会主动给你保存的，不保存以后就找不到了。

如何找回保存的记录？ 点击左侧栏的小箭头，就能看到最近保存的记录。如果记录太多找不到了，你可以点击左侧栏的库（Library），这里有你保存过的所有历史记录，还可以搜索帮助你快速找到对应的记录。

自动保存模式： 如果你不想每次都在这里点击保存记录，那么我们可以点击这里的齿轮，开启自动保存模式。以后你就不需要每次都保存历史记录了，这是一个非常好用的功能！

进阶功能：比较模式与提示画廊

05. 比较模式：优中选优

AI 模型更新迭代如此之快，你想知道不同模型的回答有什么区别吗？或者想让两个模型同时给你答案，让你优中选优？那么用比较模式就对了！

点击进入后，会出现两个并排的聊天窗口。左边我选择最新的 Gemini 2.5 Pro，右边选择上一个版本，同时打开谷歌搜索，问一个相同的问题。例如，查询一下互联技术。你可以明显看到，新模型的回答会更加详细。我经常用这个功能快速筛选出最满意的答案，非常好用。

06. 提示画廊：学习与借鉴

很多人看了这期视频之后，还是不知道在自己的场景中如何使用 AI。别担心，谷歌也想到了这个问题，它把常见的使用场景都做成了模板，放在了提示画廊里面。你可以看到非常多的模板！

例如，你想要用 Gemini 生成图片，但不知道怎么写提示词，你只需要点击“使用 Gemini 生成一张图片”这个模板，它就会自动帮你跳转到聊天页面，并且填写好提示词、选好模型、设置好所有的参数。你只需要点击运行就能看到效果。然后你可以模仿它的提示词，修改成你想要的样子，举一反三。例如，我让它帮我生成一个金毛在海上冲浪的照片，姿势要帅。你看，是不是又降低了使用难度？

07. 个性化设置：优化你的工作台

最后，我分享几个我自己的使用习惯：

如果屏幕小，我会点击下面的按钮，把左侧的功能列表收起来，阅读更清爽。
设置好模型后，也可以关掉右侧的设置页面，这样你就能得到一个干净又简洁的 AI 聊天窗口。
如果你和我一样长期使用电脑，建议你点击顶部的齿轮，选择月亮图标切换到暗黑模式，就能有效减少视觉疲劳。

实时流：与 AI 进行沉浸式互动

接下来我们看左侧功能区的第二大功能：实时流。这个名字听起来可能有点专业，但你只要把它简单理解成与 Gemini 进行实时的通话就行了。它有四种通话方式：

文字聊天： 输入的内容会以非常自然、标准的语音读出来。
语音聊天： 就像用微信语音一样，直接和它对话，非常丝滑。
视频通话： 它可以调用摄像头，看到你面前的东西。你可以用它来学习吉他的指法，或者用它来指导你做菜。
屏幕共享： 这个功能非常强大！你可以把电脑屏幕共享给它。比如你搞不定一个表格函数或者代码卡住了，直接让它看你的屏幕，手把手教你怎么解决。

只要你的电脑有麦克风和摄像头，就能解锁这些超酷炫的交互体验！

生成媒体：一站式内容创作

我们再看第三个功能板块：生成媒体。谷歌已经把所有的生成类功能都整合到了这里，你可以在这个页面里面搞定图像、语音、视频、音乐创作，非常方便。

09. 生成图片：Imagen 3 的震撼效果

这里有两个生成图片的选项：

Gemini 图像生成： 点击后就会跳转到聊天界面，并自动帮你切换到适合生成图片的模型。你只需要用大白话描述你想要的画面就行。例如，生成一个金毛举着一个花篮，花篮里面有各种各样的鲜花，背景是温馨的家。生成的图片质量不错，但还不是最强的。
Imagen 3 模型： 我们回到生成媒体的板块，选择第二个生成图片的选项，你会看到界面不一样了。这里使用的是更加强大的 Imagen 3 模型。需要说明的是，谷歌最顶级的图片模型 Imagen 4 目前主要在 Gemini App 里面使用，而 AI Studio 里面免费开放的 Imagen 3 效果也绝对让你惊艳。这里可以控制生成的数量和尺寸。要注意的是，中文提示词在这里可能识别不准，最好先用 Gemini 把你的想法翻译成英文再贴过来。我们用相同的提示词生成一个 16:9 的图片。你看，Imagen 3 生成的图片质量是不是明显高出一大截？可惜有免费的使用额度，不然是真的香。

10. 生成音频：自然逼真的语音

谷歌的语音生成技术绝对是世界顶级的，你几乎听不出 AI 的痕迹。在这里你可以选择单人或者多人的语音模式。

单人模式： 很简单，选择一个你喜欢的音色，定义一下说话的风格（这里我保持默认），然后输入文字，点击运行，就能生成一段效果非常自然的语音。
多人语音模式： 也一样简单，就像写剧本一样。我们先把这里的示例删掉，语言风格保持默认就行。然后我们设置好两个角色，例如甄嬛和沈眉庄，并为它们选择不同的音色。然后通过添加对话，轮流输入它们的台词。输入好之后点击运行，这样一段多人对话的音频就诞生了。

倘若未来能够克隆声音，那就更完美了！

11. 生成视频：让画面动起来

是的，你没有看错，它还可以生成视频！这里同样提供了一些免费的额度供你测试。你可以上传一张图片，然后用英文提示词告诉它你想要画面动起来。可以设置时长和尺寸，点击运行等待一会儿，一段视频就生成好了。当然和图片一样，谷歌最强的视频模型 Veo 3 目前主要是通过特定的渠道供部分的用户进行体验。可以说，谷歌在 AI 领域已经是绝对的霸主地位，不得不承认，你大爷还是你大爷！

12. 音乐创作：释放你的音乐天赋

如果你有音乐天赋的话，一定要试试这个功能！这个界面非常像 DJ 打碟的设备，说实话我是看不太懂。我就随便地“扭一扭、舔一舔、泡一泡”，然后点击播放。你还别说，出来的效果还不错！

构建应用：简易应用开发平台

最后我们简单来看一下第四个板块：构建应用。你可以把它简单理解成简易的应用开发平台，有点像 ChatGPT 里面的 GPTs。这里面有别人创建好的应用，你也可以自己做一个。比如这个“提示词 DJ”，点进去你就可以在左边用聊天的方式，让 AI 在右边帮助你生成一个音乐创作的应用出来。

这功能对于普通用户来说可能有点复杂，这里我就不深入了。如果你对编程感兴趣的话可以自己探索一下，在 AI 的帮助下编程门槛已经大大降低了。

总结与展望

到目前为止，我们从 Google AI Studio 的界面布局、核心聊天功能聊到了四种实时交互，以及生成图片、音频、视频和音乐。你会发现，现在的 Gemini 之所以成为 AI 领域的霸主，确实是有原因的：功能非常全面，而且大部分你都可以免费使用。

我相信一句话：未来 AI 不会淘汰人，但会淘汰不会使用 AI 的人。 AI 的发展实在太快了，很多人一不留神就落下了。我希望这期视频只是一个开始，能够帮助你学会如何使用 AI，让它成为你提升工作效率的强大助手。后续我还会分享更多关于 AI 的干货知识，让我们能够一起在 AI 的道路上共同进步。

按类别购物

探索 Google AI Studio：免费且强大的 AI 工具

Google AI Studio 与 Gemini App 的区别

Google AI Studio 入门：设置与基础功能

核心模型与参数：

AI 聊天功能实操与技巧

01. 提问小技巧：结构化提示词

02. 获取最新资讯：打开谷歌搜索开关

03. 系统提示词：强制中文回复

04. 保存记录与自动保存

进阶功能：比较模式与提示画廊

05. 比较模式：优中选优

06. 提示画廊：学习与借鉴

07. 个性化设置：优化你的工作台

实时流：与 AI 进行沉浸式互动

生成媒体：一站式内容创作

09. 生成图片：Imagen 3 的震撼效果

10. 生成音频：自然逼真的语音

11. 生成视频：让画面动起来

12. 音乐创作：释放你的音乐天赋

构建应用：简易应用开发平台

总结与展望

No comments

10分钟掌握 Google AI Studio：从灵感到作品的实战指南

用10分钟带你全面掌握 Google AI Studio：从入门到实战

MySQL 和 PostgreSQL：发音大不同

Information

公司简介

联系方式

友情链接

特色文章

关注我们