多模态大模型MMaDA:让AI学会「跨次元思考」,文本图像通吃的全能型选手来了!

最近,普林斯顿大学、字节跳动、清华大学和北京大学联手搞了个大事情,推出了一款名为 MMaDA 的多模态大模型! 这可不是普通的 AI,它号称能让 AI 拥有“深度思考”的能力,还能在文本、图像、甚至复杂的推理任务之间“七十二变”,表现力直接超越了你熟悉的 GPT-4、Gemini、甚至 SDXL!你可能觉得,现在的多模态模型已经很厉害了,能看图说话,也能根据文字生成图片。

昆仑万维面向全球发布天工超级智能体Skywork Super Agents

5月22日,昆仑万维集团面向全球市场正式发布了天工超级智能体(Skywork Super Agents)。这款产品采用AI agent架构和deep research技术,能够一站式生成文档、PPT、表格、网页、播客和音视频等多种内容,标志着“AI版Office”时代的到来。天工超级智能体的发布,代表了中国在AI技术领域的重大突破。

谷歌Sparkify实验产品上线,输入问题秒变动画短片,复杂知识秒懂

谷歌推出全新实验性AI产品Sparkify,通过Gemini与Veo模型,用户只需输入一个问题或复杂概念,即可在2分钟内生成直观的动画短视频,深入浅出地讲解知识点。从“珍珠奶茶的起源”到“8小时工作制的演变”,Sparkify以其创新的教育应用场景和高效的知识传播方式引发热议。综合最新社交媒体动态,深入解析Sparkify的技术亮点及其对教育与内容创作领域的深远影响。内测申请地址:https://

OpenAI Responses API重磅更新,集成MCP、图像生成与代码解释器,AI智能体开发进入新纪元!

OpenAI宣布对其Responses API进行重大升级,新增支持Model Context Protocol(MCP)、图像生成、代码解释器和后台模式,通过单次API调用即可实现多功能智能体开发。这一更新自发布以来引发开发者社区热烈反响,被认为是OpenAI推动AI智能体生态的重要里程碑。综合最新社交媒体动态,深入解析Responses API更新的技术亮点及其对全球AI开发的影响。

OpenAI Responses API新增MCP支持与多项功能升级,助力智能体开发

OpenAI宣布其核心API——Responses API现已支持**Model Context Protocol(MCP)**,并对图像生成、Code Interpreter以及文件搜索工具进行了重大更新。这些升级极大简化了智能体开发流程,使开发者能够通过几行代码将AI智能体连接到外部工具和服务,进一步提升了API的灵活性和功能性。 MCP支持:简化智能体开发

昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!

2025年5月21日,中国AI领军企业昆仑万维正式发布天工超级智能体,一款基于自研Deep Research技术的AI Office智能代理,以其强大的多模态内容生成能力和成本仅为OpenAI40%的优势,引发全球AI社区热议。天工超级智能体由5个专家智能体和1个通用智能体组成,支持一站式生成文档、PPT、表格、网页、播客及音视频内容,其性能在GAIA基准上以82.42分超越OpenAI Deep

xAI Live Search API上线!实时搜索X平台与全球互联网,免费Beta至6月5日

xAI宣布推出Live Search API,一款支持实时动态搜索X平台、互联网、热门新闻和RSS订阅源的强大工具,目前进入免费Beta测试阶段,开放至2025年6月5日。凭借无需手动管理搜索逻辑、模型自主决策和高度可定制化的特性,Live Search API为开发者提供了前所未有的实时信息检索能力。综合最新社交媒体动态,深入解析这一API的技术亮点及其对AI生态的深远影响。

硅基流动升级DeepSeek-R1 等推理模型API ,支持 128K 上下文长度

硅基流动(SiliconCloud)宣布对其 DeepSeek-R1等推理模型 API 进行了一次重要升级,旨在更好地满足开发者对长上下文和灵活参数配置的需求。此次升级中,多个推理模型的最大上下文长度被提升至128K,使得模型在思考时能够更加充分,输出内容也更为完整。在此次升级中,多个知名模型,如 Qwen3、QWQ、GLM-Z1等,均支持128K 的最大上下文长度,而 DeepSeek-R1则支

OpenAI联手Jony Ive打造1亿台AI“伴侣”设备!2026年底前发货,颠覆智能手机的第三核心设备来了!

OpenAI宣布以65亿美元全股收购由苹果前首席设计师Jony Ive创立的AI硬件初创公司io,并计划推出一款革命性的AI“伴侣”设备,目标在2026年底前发货1亿台。据悉,该设备将完全感知用户环境,融入日常生活,成为继MacBook Pro和iPhone之后的“第三核心设备”。综合最新社交媒体动态与权威报道,深入解析这一设备的创新潜力及其对AI硬件市场的深远影响。AI“伴侣”设备:感知生活,重

腾讯大模型战略亮相 Turbo S 与 T1 模型全面升级

5月21日,腾讯宣布其混元大模型矩阵全面升级,标志着腾讯在人工智能领域的技术能力持续提升。此次升级涵盖了多个方面,包括旗舰快思考模型混元TurboS、深度思考模型混元T1的升级,以及基于TurboS基座新推出的视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。此外,腾讯还同步更新了混元图像2.0、混元3D v2.5及混元游戏视觉生成等一系列多模态模型。