-
Genie-谷歌发布的AI基础世界模型,一张图片生成交互世界
Genie是由谷歌发布的根据互联网视频训练的基础世界模型,该模型参数规模为11B,可以从合成图像、照片甚至草图生成无数种动作可控的交互式环境。- 5.1k
- 0
-
Gemma-谷歌发布的最新开放模型,小尺寸可商用
Gemma是谷歌最新发布的一款开放模型,属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。- 11.7k
- 0
-
-
MusicFX-谷歌发布的免费AI音乐生成工具
MusicFX为音乐创作者提供了丰富的音效和声音素材,用户可以创作各种类型的音乐,同时支持调整音调、节奏和音量,还可以添加混响、回声等效果。无论是想要营造舒缓的氛围还是冒险紧张的氛围,MusicFX都可以满足。- 6k
- 0
-
Imagen 2:谷歌发布的AI绘画模型
Imagen 2是Google DeepMind开发的最先进的文本到图像扩散技术。它能够生成高质量、逼真的图像,这些图像与用户的提示紧密对齐且一致。- 5.6k
- 0
-
W.A.L.T:通过扩散模型生成逼真视频的AI模型
近日,谷歌与李飞飞的斯坦福团队携手推出了基于Transformer的视频生成模型W.A.L.T。该模型利用因果编码器和窗口注意的变压器架构,成功将图像和视频压缩到一个共享的潜在空间,实现了联合训练和生成。这一创新性的模型不仅在已建立的视频和图像生成基准测试上取得了SOTA,还展示了在文本到视频生成任务中的卓越性能。 这种方法有两个关键的设计决策。首先,它使用因果编码器共同压缩图像和视频,使其在统一…- 2.5k
- 0
-
AlphaCode2-Google公布的基于Gemini的AI编程助手
谷歌日前发布了AlphaCode2,这是一款由Gemini模型驱动的AI编程工具,是对前代AlphaCode的改进版本。与Gemini模型同时亮相,AlphaCode2在编程竞赛中表现出色,尤其在动态规划等复杂问题上具备更强大的能力。 研究人员通过在CodeForces竞赛网站上收集的约15000个问题和3000万份人类编写的代码的数据集上对Gemini Pro系统进行精细调整,为AlphaCod…- 2.7k
- 0
-
Gemini-谷歌发布的多模态AI大模型
AIHub 12 月 6 日消息,谷歌宣布推出其认为规模最大、功能最强大的人工智能多模态AI模型 Gemini。意味着它可以理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。- 25.2k
- 0
-
-
谷歌即将发布对话式人工智能软件Gemini 挑战OpenAI的GPT-4
据报道,谷歌即将发布其对话式人工智能软件 Gemini。这家科技巨头已经让一些选定的公司提前获得 Gemini 的早期版本,该版本旨在与 OpenAI 的 GPT-4模型竞争。- 624
- 0
-
与 ChatGPT 展开竞争:谷歌聊天机器人 Bard 拓展至欧洲和巴西
北京时间7月14日早间消息 据报道,当地时间周四,谷歌公司表示将在欧洲和巴西推出人工智能聊天机器人Bard,这是该公司自今年2月推出该产品以来最大规模的扩张,并将与微软支持的聊天机器人ChatGPT展开竞争。- 416
- 0
-