AI快讯
字节跳动与清华大学合作推出时序多模态大模型ChatTS
在多模态大语言模型(MLLM)迅速发展的浪潮中,字节跳动与清华大学近日联合发布了名为 ChatTS 的新型时序多模态大模型。ChatTS 的推出不仅为时序数据的处理与推理注入了新活力,也填补了当前市场在这一领域的空白。该模型的开发旨在提升 AI 在时序数据问答与推理中的应用能力,尤其在 AIOps 与金融等需要处理复杂时序数据的场景中显得尤为重要。
Anthropic震撼发布Claude4 :全球最强编码AI,自动写代码 7 小时刷新纪录
作为人工智能领域的先锋,Anthropic于2025年5月22日正式发布了Claude4系列模型,包括Claude Opus4和Claude Sonnet4,开启了编码、复杂推理和 AI 代理的新篇章。Claude Opus4被誉为全球最佳编码模型,能够持续高效地处理复杂的长时间任务和代理工作流。而 Claude Sonnet4则是对 Sonnet3.7的重大升级,能够更精准地响应用户指令,展现出
字节发布14B参数多模态神器BAGEL,碾压Qwen2.5-VL,图像生成媲美SD3
字节跳动Seed团队在Hugging Face平台重磅发布BAGEL,一款基于混合专家(MoE)架构的开源多模态基础模型,拥有14亿总参数和7亿活跃参数。BAGEL在数万亿token的交错多模态数据集上预训练,性能超越Qwen2.5-VL和InternVL-2.5,图像生成质量媲美SD3,并支持复杂推理任务如自由图像编辑、未来帧预测和3D生成,引发全球AI社区热议。
一图生万物?AI“神笔马良”3DTown,单张照片变3D城市,这波操作太秀了!
最近,一项黑科技直接颠覆了我们对3D 世界构建的认知!普林斯顿大学、哥伦比亚大学和一家叫 Cyberever AI 的公司,联手推出了一套名叫3DTown 的框架。听名字就知道,它就是来帮你搞3D 城镇的!最骚的是什么?它能仅仅凭借一张俯视图,就能帮你生成一个逼真、连贯的3D 城镇场景! 而且,它还是个免训练(training-free)的框架,这意味着你不用费劲巴拉地去收集海量3D 数据来训练
Anthropic拒绝为Windsurf提供Claude Sonnet 4与Opus 4支持,商战大戏开演!
Anthropic在Code with Claude开发者大会上宣布,其最新模型Claude Sonnet4和Claude Opus4已全面上线,但明确拒绝为编码工具Windsurf提供直接支持,导致Windsurf成为唯一无法使用Claude4系列模型的AI编码平台。此举引发了开发者社区的广泛热议,并被认为是AI市场竞争加剧的信号。
谷歌Beam发布!2D视频秒变3D沉浸式体验,实时翻译+真实眼神交流
Google I/O大会上,Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心,将传统的2D视频通话升级为身临其境的3D体验,旨在让远程沟通如同面对面般真实自然。为您带来这一前沿科技的最新资讯,解析其技术亮点与未来潜力。从 Project Starline 到 Google Beam:技术进化的里程碑Google Beam脱胎于2021年首次亮相的
谷歌DeepMind发布新AI音乐生成模型Lyria2,支持实时创作
谷歌DeepMind正式发布了其最新音乐生成模型 Lyria2,标志着人工智能在音乐创作领域的又一重大突破。作为前代Lyria模型的升级版本,Lyria2以其高保真音质、实时交互功能和多风格适配性,为音乐家、制作人和内容创作者提供了前所未有的创作工具。高保真音质,捕捉音乐细微之美Lyria2在音质表现上实现了显著突破,能够生成48kHz立体声音频,达到专业级水准。无论是古典音乐的优雅旋律,还是电子
多模态大模型MMaDA:让AI学会「跨次元思考」,文本图像通吃的全能型选手来了!
最近,普林斯顿大学、字节跳动、清华大学和北京大学联手搞了个大事情,推出了一款名为 MMaDA 的多模态大模型! 这可不是普通的 AI,它号称能让 AI 拥有“深度思考”的能力,还能在文本、图像、甚至复杂的推理任务之间“七十二变”,表现力直接超越了你熟悉的 GPT-4、Gemini、甚至 SDXL!你可能觉得,现在的多模态模型已经很厉害了,能看图说话,也能根据文字生成图片。
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
5月22日,昆仑万维集团面向全球市场正式发布了天工超级智能体(Skywork Super Agents)。这款产品采用AI agent架构和deep research技术,能够一站式生成文档、PPT、表格、网页、播客和音视频等多种内容,标志着“AI版Office”时代的到来。天工超级智能体的发布,代表了中国在AI技术领域的重大突破。
谷歌Sparkify实验产品上线,输入问题秒变动画短片,复杂知识秒懂
谷歌推出全新实验性AI产品Sparkify,通过Gemini与Veo模型,用户只需输入一个问题或复杂概念,即可在2分钟内生成直观的动画短视频,深入浅出地讲解知识点。从“珍珠奶茶的起源”到“8小时工作制的演变”,Sparkify以其创新的教育应用场景和高效的知识传播方式引发热议。综合最新社交媒体动态,深入解析Sparkify的技术亮点及其对教育与内容创作领域的深远影响。内测申请地址:https://
闽公网安备35020302036513号