第10页_文章博客_碳水AI导航

微软开源Magentic-UI，重新定义人机协同网页自动化

Microsoft Build开发者大会上，微软正式推出了其开源项目Magentic-UI，一款以人为中心的人工智能网页代理系统。这款创新工具旨在通过智能自动化处理复杂网页任务，同时确保用户全程掌控操作流程。为您深入解析这一突破性技术的核心亮点及其潜在影响。Magentic-UI:人机协同的智能网页助手Magentic-UI是微软基于其Magentic-One和AutoGen框架开发的开源原型，旨

AI快讯

2025-05-23

谷歌Beam发布！2D视频秒变3D沉浸式体验，实时翻译+真实眼神交流

Google I/O大会上，Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心，将传统的2D视频通话升级为身临其境的3D体验，旨在让远程沟通如同面对面般真实自然。为您带来这一前沿科技的最新资讯，解析其技术亮点与未来潜力。从 Project Starline 到 Google Beam:技术进化的里程碑Google Beam脱胎于2021年首次亮相的

AI快讯

2025-05-23

DMind引领Web3AI革命:推出首批专业区块链大语言模型DMind-1系列

在人工智能与区块链技术加速融合的关键时刻，开源AGI研究机构DMind正以其创新性的Web3专用语言模型引领行业变革。该机构近日发布了DMind-1和DMind-1-mini两款领域专用大型语言模型，专门针对区块链、去中心化金融和智能合约等Web3应用场景进行深度优化。专业化AI模型的技术突破DMind-1系列模型代表了AI技术在垂直领域应用的重要进展。

AI快讯

2025-05-23

字节跳动与清华大学合作推出时序多模态大模型ChatTS

在多模态大语言模型（MLLM）迅速发展的浪潮中，字节跳动与清华大学近日联合发布了名为 ChatTS 的新型时序多模态大模型。ChatTS 的推出不仅为时序数据的处理与推理注入了新活力，也填补了当前市场在这一领域的空白。该模型的开发旨在提升 AI 在时序数据问答与推理中的应用能力，尤其在 AIOps 与金融等需要处理复杂时序数据的场景中显得尤为重要。

AI快讯

2025-05-23

Anthropic震撼发布Claude4 ：全球最强编码AI，自动写代码 7 小时刷新纪录

作为人工智能领域的先锋，Anthropic于2025年5月22日正式发布了Claude4系列模型，包括Claude Opus4和Claude Sonnet4，开启了编码、复杂推理和 AI 代理的新篇章。Claude Opus4被誉为全球最佳编码模型，能够持续高效地处理复杂的长时间任务和代理工作流。而 Claude Sonnet4则是对 Sonnet3.7的重大升级，能够更精准地响应用户指令，展现出

AI快讯

2025-05-23

字节发布14B参数多模态神器BAGEL，碾压Qwen2.5-VL，图像生成媲美SD3

字节跳动Seed团队在Hugging Face平台重磅发布BAGEL，一款基于混合专家（MoE）架构的开源多模态基础模型，拥有14亿总参数和7亿活跃参数。BAGEL在数万亿token的交错多模态数据集上预训练，性能超越Qwen2.5-VL和InternVL-2.5，图像生成质量媲美SD3，并支持复杂推理任务如自由图像编辑、未来帧预测和3D生成，引发全球AI社区热议。

AI快讯

2025-05-23

一图生万物？AI“神笔马良”3DTown，单张照片变3D城市，这波操作太秀了！

最近，一项黑科技直接颠覆了我们对3D 世界构建的认知!普林斯顿大学、哥伦比亚大学和一家叫 Cyberever AI 的公司，联手推出了一套名叫3DTown 的框架。听名字就知道，它就是来帮你搞3D 城镇的!最骚的是什么?它能仅仅凭借一张俯视图，就能帮你生成一个逼真、连贯的3D 城镇场景! 而且，它还是个免训练（training-free）的框架，这意味着你不用费劲巴拉地去收集海量3D 数据来训练

AI快讯

2025-05-23

Anthropic拒绝为Windsurf提供Claude Sonnet 4与Opus 4支持，商战大戏开演！

Anthropic在Code with Claude开发者大会上宣布，其最新模型Claude Sonnet4和Claude Opus4已全面上线，但明确拒绝为编码工具Windsurf提供直接支持，导致Windsurf成为唯一无法使用Claude4系列模型的AI编码平台。此举引发了开发者社区的广泛热议，并被认为是AI市场竞争加剧的信号。

AI快讯

2025-05-23

谷歌Beam发布！2D视频秒变3D沉浸式体验，实时翻译+真实眼神交流

Google I/O大会上，Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心，将传统的2D视频通话升级为身临其境的3D体验，旨在让远程沟通如同面对面般真实自然。为您带来这一前沿科技的最新资讯，解析其技术亮点与未来潜力。从 Project Starline 到 Google Beam:技术进化的里程碑Google Beam脱胎于2021年首次亮相的

AI快讯

2025-05-23

谷歌DeepMind发布新AI音乐生成模型Lyria2，支持实时创作

谷歌DeepMind正式发布了其最新音乐生成模型 Lyria2，标志着人工智能在音乐创作领域的又一重大突破。作为前代Lyria模型的升级版本，Lyria2以其高保真音质、实时交互功能和多风格适配性，为音乐家、制作人和内容创作者提供了前所未有的创作工具。高保真音质，捕捉音乐细微之美Lyria2在音质表现上实现了显著突破，能够生成48kHz立体声音频，达到专业级水准。无论是古典音乐的优雅旋律，还是电子

AI快讯

2025-05-22