它能做什么?只需一句话,它就能生成电影级别的视频片段;它能实时共享你的屏幕,手把手教你解决电脑问题;它甚至能创作出专业级别的音乐。
这篇指南将带你全面了解 Google AI Studio,无论你是 AI 小白还是经验丰富的用户,都能轻松掌握这款强大的生产力工具。
Google AI Studio 与 Gemini App 的区别
或许你会问,既然有用户界面更友好的 Gemini App,为什么还要选择 Google AI Studio 呢?虽然两者都搭载了顶级的 Gemini 2.5 Pro 模型,但它们之间存在显著差异:
- Google AI Studio:专为开发者和 AI 创作者设计,需要一些探索精神。它能对问题进行更深入、更专业的分析。
- Gemini App:面向普通用户,几乎没有技术门槛,开箱即用。它的回答通常更简洁,有时甚至会显得过于迎合。
如果你真的想利用 AI 提升工作效率,我强烈建议你直接上手 Google AI Studio。尽管界面稍显复杂,但只要跟着本指南一步步操作,你就能彻底掌握它的使用方法,从而显著提升效率。
小贴士: 我强烈建议你在每次看完案例示范后,暂停视频并亲自操作一遍,这是最快掌握 AI 技能的方法。
Google AI Studio 入门:设置与基础功能
现在,你可以在浏览器中搜索 Google AI Studio。中国用户请记得开启“魔法”并设置成美国全局模式。登录你的 Google 账号后,你将进入 Google AI Studio 的界面。初次接触可能会觉得有点复杂,但这很正常,熟悉之后就会觉得非常简单。
个性化设置:
- 沉浸式翻译插件: 我建议你安装一个沉浸式翻译插件,这样即使英文不好,也能轻松将界面翻译成中文,让语言不再是障碍。
- AI 聊天窗口: 界面中间是 AI 的聊天窗口,使用起来和普通的聊天软件一样简单。
- 右侧设置选项: 右侧有很多设置选项,看起来复杂,但我们只需关注最重要的三个。
核心模型与参数:
将鼠标悬停在模型名称上,你将看到当前选择模型的详细信息。我们今天主要使用的是 Google 最新发布的旗舰模型 Gemini 2.5 Pro。
- 数据统计(Token 统计): Token 是 AI 理解语言的基本单位,你可以简单理解为它在计算你与 AI 交互时所消耗的资源量。Gemini 2.5 Pro 作为谷歌最新最强的模型,拥有顶级的思考和推理能力,反应更快、效率更高。谷歌提供的免费套餐非常慷慨,对于个人正常使用和学习来说绰绰有余,你完全不用担心免费额度的问题。
- 温度(Temperature): 你可以将其理解为 AI 回答的创造力和想象力。
- 设置为 0:回答可能非常严谨、死板。
- 设置为 2:回答可能天马行空、充满创意。
- 我通常保持默认值 1:回答既不死板也不会过于跳跃,恰到好处。
- 高级设置: 除非你是程序员,否则这些高级设置都可以保持默认,完全不影响使用。
AI 聊天功能实操与技巧
现在,我们来实际操作一下,让 AI 帮助我们整理最近一周的 AI 热点新闻。
01. 提问小技巧:结构化提示词
我分享一个提问小技巧:使用结构化的提示词,输出的内容会非常准确。就像这样,将你的需求拆分成几个方面:目的、时间、范围、输出的格式。其实这并不难,你模仿几次就会有感觉了。
02. 获取最新资讯:打开谷歌搜索开关
点击运行后,你可能会发现 AI 给出的答案是旧数据。解决这个问题很简单,来到右侧,把谷歌搜索的开关打开。如果你不想要旧的答案,想让它重新生成,操作也很简单:将鼠标放在回答上,看到 Gemini 的图标后点击一下,它就能联网搜索并为你生成最新的内容。你看,这次的内容就是最新的了!
03. 系统提示词:强制中文回复
用久了之后,你会发现它有时会突然回复英文,体验很不好。我建议你使用系统提示词,强制它只说中文。点击这里的系统提示词,告诉它你必须用简体中文进行回复。设置好后将其折叠起来就行了,这样在这个聊天窗口里面,它就不会再乱飙英文了。虽然换新的窗口需要重新设置,但这是一个非常有效的小技巧。
04. 保存记录与自动保存
如果觉得这次的聊天内容很有用,一定要点击右上角的保存,否则 Google AI Studio 是不会主动给你保存的,不保存以后就找不到了。
如何找回保存的记录? 点击左侧栏的小箭头,就能看到最近保存的记录。如果记录太多找不到了,你可以点击左侧栏的库(Library),这里有你保存过的所有历史记录,还可以搜索帮助你快速找到对应的记录。
自动保存模式: 如果你不想每次都在这里点击保存记录,那么我们可以点击这里的齿轮,开启自动保存模式。以后你就不需要每次都保存历史记录了,这是一个非常好用的功能!
进阶功能:比较模式与提示画廊
05. 比较模式:优中选优
AI 模型更新迭代如此之快,你想知道不同模型的回答有什么区别吗?或者想让两个模型同时给你答案,让你优中选优?那么用比较模式就对了!
点击进入后,会出现两个并排的聊天窗口。左边我选择最新的 Gemini 2.5 Pro,右边选择上一个版本,同时打开谷歌搜索,问一个相同的问题。例如,查询一下互联技术。你可以明显看到,新模型的回答会更加详细。我经常用这个功能快速筛选出最满意的答案,非常好用。
06. 提示画廊:学习与借鉴
很多人看了这期视频之后,还是不知道在自己的场景中如何使用 AI。别担心,谷歌也想到了这个问题,它把常见的使用场景都做成了模板,放在了提示画廊里面。你可以看到非常多的模板!
例如,你想要用 Gemini 生成图片,但不知道怎么写提示词,你只需要点击“使用 Gemini 生成一张图片”这个模板,它就会自动帮你跳转到聊天页面,并且填写好提示词、选好模型、设置好所有的参数。你只需要点击运行就能看到效果。然后你可以模仿它的提示词,修改成你想要的样子,举一反三。例如,我让它帮我生成一个金毛在海上冲浪的照片,姿势要帅。你看,是不是又降低了使用难度?
07. 个性化设置:优化你的工作台
最后,我分享几个我自己的使用习惯:
- 如果屏幕小,我会点击下面的按钮,把左侧的功能列表收起来,阅读更清爽。
- 设置好模型后,也可以关掉右侧的设置页面,这样你就能得到一个干净又简洁的 AI 聊天窗口。
- 如果你和我一样长期使用电脑,建议你点击顶部的齿轮,选择月亮图标切换到暗黑模式,就能有效减少视觉疲劳。
实时流:与 AI 进行沉浸式互动
接下来我们看左侧功能区的第二大功能:实时流。这个名字听起来可能有点专业,但你只要把它简单理解成与 Gemini 进行实时的通话就行了。它有四种通话方式:
- 文字聊天: 输入的内容会以非常自然、标准的语音读出来。
- 语音聊天: 就像用微信语音一样,直接和它对话,非常丝滑。
- 视频通话: 它可以调用摄像头,看到你面前的东西。你可以用它来学习吉他的指法,或者用它来指导你做菜。
- 屏幕共享: 这个功能非常强大!你可以把电脑屏幕共享给它。比如你搞不定一个表格函数或者代码卡住了,直接让它看你的屏幕,手把手教你怎么解决。
只要你的电脑有麦克风和摄像头,就能解锁这些超酷炫的交互体验!
生成媒体:一站式内容创作
我们再看第三个功能板块:生成媒体。谷歌已经把所有的生成类功能都整合到了这里,你可以在这个页面里面搞定图像、语音、视频、音乐创作,非常方便。
09. 生成图片:Imagen 3 的震撼效果
这里有两个生成图片的选项:
- Gemini 图像生成: 点击后就会跳转到聊天界面,并自动帮你切换到适合生成图片的模型。你只需要用大白话描述你想要的画面就行。例如,生成一个金毛举着一个花篮,花篮里面有各种各样的鲜花,背景是温馨的家。生成的图片质量不错,但还不是最强的。
- Imagen 3 模型: 我们回到生成媒体的板块,选择第二个生成图片的选项,你会看到界面不一样了。这里使用的是更加强大的 Imagen 3 模型。需要说明的是,谷歌最顶级的图片模型 Imagen 4 目前主要在 Gemini App 里面使用,而 AI Studio 里面免费开放的 Imagen 3 效果也绝对让你惊艳。这里可以控制生成的数量和尺寸。要注意的是,中文提示词在这里可能识别不准,最好先用 Gemini 把你的想法翻译成英文再贴过来。我们用相同的提示词生成一个 16:9 的图片。你看,Imagen 3 生成的图片质量是不是明显高出一大截?可惜有免费的使用额度,不然是真的香。
10. 生成音频:自然逼真的语音
谷歌的语音生成技术绝对是世界顶级的,你几乎听不出 AI 的痕迹。在这里你可以选择单人或者多人的语音模式。
- 单人模式: 很简单,选择一个你喜欢的音色,定义一下说话的风格(这里我保持默认),然后输入文字,点击运行,就能生成一段效果非常自然的语音。
- 多人语音模式: 也一样简单,就像写剧本一样。我们先把这里的示例删掉,语言风格保持默认就行。然后我们设置好两个角色,例如甄嬛和沈眉庄,并为它们选择不同的音色。然后通过添加对话,轮流输入它们的台词。输入好之后点击运行,这样一段多人对话的音频就诞生了。
倘若未来能够克隆声音,那就更完美了!
11. 生成视频:让画面动起来
是的,你没有看错,它还可以生成视频!这里同样提供了一些免费的额度供你测试。你可以上传一张图片,然后用英文提示词告诉它你想要画面动起来。可以设置时长和尺寸,点击运行等待一会儿,一段视频就生成好了。当然和图片一样,谷歌最强的视频模型 Veo 3 目前主要是通过特定的渠道供部分的用户进行体验。可以说,谷歌在 AI 领域已经是绝对的霸主地位,不得不承认,你大爷还是你大爷!
12. 音乐创作:释放你的音乐天赋
如果你有音乐天赋的话,一定要试试这个功能!这个界面非常像 DJ 打碟的设备,说实话我是看不太懂。我就随便地“扭一扭、舔一舔、泡一泡”,然后点击播放。你还别说,出来的效果还不错!
构建应用:简易应用开发平台
最后我们简单来看一下第四个板块:构建应用。你可以把它简单理解成简易的应用开发平台,有点像 ChatGPT 里面的 GPTs。这里面有别人创建好的应用,你也可以自己做一个。比如这个“提示词 DJ”,点进去你就可以在左边用聊天的方式,让 AI 在右边帮助你生成一个音乐创作的应用出来。
这功能对于普通用户来说可能有点复杂,这里我就不深入了。如果你对编程感兴趣的话可以自己探索一下,在 AI 的帮助下编程门槛已经大大降低了。
总结与展望
到目前为止,我们从 Google AI Studio 的界面布局、核心聊天功能聊到了四种实时交互,以及生成图片、音频、视频和音乐。你会发现,现在的 Gemini 之所以成为 AI 领域的霸主,确实是有原因的:功能非常全面,而且大部分你都可以免费使用。
我相信一句话:未来 AI 不会淘汰人,但会淘汰不会使用 AI 的人。 AI 的发展实在太快了,很多人一不留神就落下了。我希望这期视频只是一个开始,能够帮助你学会如何使用 AI,让它成为你提升工作效率的强大助手。后续我还会分享更多关于 AI 的干货知识,让我们能够一起在 AI 的道路上共同进步。