AI快讯

MiniMax Speech-02碾压OpenAI与ElevenLabs,登顶全球TTS榜首

MiniMax Audio推出的Speech-02系列语音模型席卷全球,强势登顶Artificial Analysis Speech Arena和Hugging Face TTS Arena两大权威榜单,力压ElevenLabs、OpenAI等国际顶尖竞争对手。这款模型以超高语音逼真度和多语言支持惊艳业界,成为AI语音技术的全新标杆。

大语言模型也有“健忘症”?Supermemory推出“无限记忆外挂”,让你的AI永不失忆!

在与ChatGPT或Claude等大语言模型长时间对话时,你是否也遇到过对话内容突然"失忆"的尴尬场景?这并非AI有意为之,而是受限于大语言模型固有的上下文窗口限制。无论是8k、32k还是128k tokens的容量,一旦超过这个阈值,先前的对话内容就会被截断丢失,导致交互体验严重受损。近日,一家名为Supermemory的公司推出了一项颠覆性技术——Infinite Chat API,号称能无限

Firecrawl模板发布!点几下将任意网站变LLM就绪数据,AI开发提速10倍!

Firecrawl宣布正式发布模板(Templates),一套集成了游乐场设置、代码片段和完整存储库的开源工具包,旨在帮助开发者以最简单的方式将任意网站转化为大语言模型(LLM)就绪数据。这一创新极大降低了AI数据抓取的技术门槛,为构建AI驱动的应用程序注入了新动能。深入解析Firecrawl模板的核心功能及其对AI生态的影响,带您一探这一抓取神器的魅力。模板核心:一键式数据抓取解决方案

SmolVLM登场!WebGPU驱动实时网络摄像头AI,零服务器、本地运行,点开网页秒体验!

Hugging Face推出的SmolVLM多模态模型迎来重大突破:通过WebGPU技术,SmolVLM现可在浏览器中实现实时网络摄像头图像识别,无需服务器支持,全部计算在用户设备上完成。这一创新不仅提升了隐私保护,还极大降低了AI应用的部署门槛。综合最新动态,深入解析SmolVLM的本地化实时演示及其对AI生态的影响。技术核心:WebGPU赋能本地化AI推理SmolVLM是一款超轻量多模态模型,

Hugging Face上线MCP免费教程!一天速成AI上下文协议

Hugging Face再度为全球AI开发者带来惊喜,正式发布Model Context Protocol(MCP)免费在线课程。作为连接大语言模型(LLM)与外部数据和工具的标准化协议,MCP正成为AI Agent开发的核心技术。这门课程从MCP协议基础到实际开发应用,内容简洁实用,旨在让开发者快速上手,构建高效的AI上下文交互系统。深入解析这一课程亮点,揭示其对AI生态的深远意义。

大群将至:通付盾推出多智能体协同平台Legion

AI应用时代以智能体(Agent)为应用核心,以多智能体协同(InterAgent,or IA)为技术核心,大规模智能体协同是构建具备商业价值的智能体经济的必经之路。目前市面上一般将这种多智能体集群称之为Swarms,词义指大规模昆虫或人成群移动,而我们更偏向用另外一个术语来表述——“Legion”。

Llamafile 0.9.3震撼支持Qwen3!单文件运行大模型,跨平台便携性炸裂,AI推理更简单!

近日,Mozilla旗下开源项目Llamafile发布0.9.3版本,正式宣布支持Qwen3系列大语言模型。这一更新通过融合llama.cpp与Cosmopolitan Libc,将复杂的大模型推理过程浓缩为一个可执行文件,极大提升了跨平台便携性和部署效率。深入解读这一突破性进展,探索Llamafile如何为AI开发者与用户带来全新体验。技术核心:单文件集成,极致便携

Stability AI开源341M超轻量文字转语音模型,手机本地可跑,音频生成仅需8秒!

Stability AI最近又开源了一个模型,名字有点长,叫“Adversarial Post-Training 加速的快速文字转音频生成”,听起来很硬核对不对?但你只需要记住它的核心特点:超!级!快!而!且!超!级!轻!以前我们用的文字转语音,就像老式的烧水壶,得等半天才能咕嘟咕嘟地出声。而且那些高质量的模型,往往体型巨大,像个“胖墩”,塞到手机里根本跑不动。

谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题,优化芯片与数据中心,训练速度飙升32.5%!

谷歌DeepMind发布了一项颠覆性研究成果——AlphaEvolve,一款结合Gemini大语言模型与进化算法的AI编码代理。这款系统不仅能自动发现和优化复杂算法,还在谷歌的数据中心、芯片设计和AI训练中展现了惊人实力,甚至助力Gemini模型自我优化,堪称AI领域的“左脚踩右脚”式突破。深入剖析这一技术里程碑,揭示其核心原理与广泛影响。

清华携手面壁智能重磅开源!首款中文APP专精GUI Agent,覆盖高德、B站、小红书

随着人工智能技术的迅猛发展,智能化交互成为移动互联网的新焦点。近日,清华大学THUNLP实验室与面壁智能联合发布了一款革命性的开源项目——AgentCPM-GUI,这是全球首个针对中文APP精细优化的开源GUI(图形用户界面)Agent。该项目不仅展示了国产AI技术的硬核实力,还为安卓生态的智能化升级提供了全新可能。模型地址:https://huggingface.co/openbmb/Agent