文章
关键词 [Kimi] 的搜索结果:
-
Kimi-VL:月之暗面开源的视觉语言模型
Kimi-VL 是由月之暗面推出的一款开源视觉语言模型(VLM),具备原生分辨率图像理解、多模态推理和128K长上下文处理能力。 -
Kimi-Audio:Kimi开源的通用音频基础模型,支持语音识别、音频理解等多种任务
Kimi-Audio是kimi开源的全新通用音频基础模型,支持语音识别、音频理解、音频转文本、语音对话等多种任务,在十多个音频基准测试中实现了最先进的 (SOTA) 性能。 -
MoonshotAI开源Kimi-Audio,重新定义音频处理领域
近日,MoonshotAI 开源了其最新音频基础模型 Kimi-Audio,这一模型凭借其卓越的性能和创新架构,有望在音频处理领域掀起一场变革。 架构革新 Kimi-Audio 采用了集成式架构,包含音频分词器、音频大模型和音频去分词器三大核心组件。音频分词器将输入音频转化为离散语义 token 和连续声学向量,音频大模型基于 Transformer 架构处理多模态输入,而音频去分词器则通过流匹配… -
Kimi-Researcher:月之暗面推出的深度研究AI智能体
Kimi-Researcher 是月之暗面开发的一款深度研究助手,基于端到端自主强化学习技术。它能够理解问题、主动搜索信息、调用工具并生成深度研究报告。