AI快讯

Midjourney V7推出全新功能 “Omni-Reference”,让图像生成更灵活

在图像生成领域,Midjourney 近期推出了一项名为 “Omni-Reference”(全向参考)的新功能,为用户带来了更大的创作自由。这一全新图像引用系统不仅是 V6版本中 “角色参考” 功能的升级版,更是赋予用户在创作过程中对图像元素的精准控制。核心功能:全向参考与多元素支持Omni-Reference通过先进的图像参考系统,为用户提供了前所未有的创作控制力。

英伟达全新开源自动语音识别模型 Parakeet-TDT-0.6B-V2,语音转录能力再提升

近日,英伟达在 Hugging Face 平台上推出了其最新的自动语音识别(ASR)模型 ——Parakeet-TDT-0.6B-V2。这一新模型不仅在性能上有显著提升,还将开源理念与商业应用相结合,吸引了广泛关注。 超强转录能力Parakeet-TDT-0.6B-V2的最大亮点在于其出色的转录效率。据称,该模型能够在仅仅一秒内完成60分钟音频的转录,极大提高了语音处理的速度。

DeepSeek-Prover-V2-671B 模型开源,数学推理领域迎来新突破

中国 AI 初创公司 DeepSeek 再次掀起开源 AI 领域的热潮,正式发布其最新开源模型 DeepSeek-Prover-V2-671B。这一拥有6710亿参数的超大规模语言模型,专为数学推理和问题解决设计,展现了 DeepSeek 在高效 AI 开发上的持续创新能力。

Anthropic Claude应用更新引入“Glassy”语音,语音模式开发持续推进

Anthropic在其Claude移动应用程序的最新更新中新增了名为“Glassy”的语音选项,进一步推动其语音模式(Voice Mode)的开发进程。据了解,“Glassy”作为Claude语音模式的新增声音,以其独特音色引发社交平台热议,被认为是迄今最具吸引力的语音选项之一。相关细节已通过Anthropic官网(anthropic.com)与Hugging Face社区公开。

70亿参数干翻320亿?小米扔出“核弹级”AI MiMo 你的“破电脑”也能跑赢奥数题和复杂代码!

小米正式在Hugging Face平台发布其首个专为推理(Reasoning)设计的开源大模型——MiMo-7B。据AIbase了解,MiMo-7B通过从预训练到后训练的强化学习(RL)优化,展现了在数学、代码和通用推理任务上的卓越性能,超越了多个32亿参数以上的基线模型。

开源界核弹!Step1X-Edit 登陆 Hugging Face,用自然语言“画”出新世界,性能直逼 GPT-4o!

开源人工智能的星空,昨夜骤然被一颗新星照亮!备受瞩目的 Step1X-Edit 图像编辑框架,已于2025年4月24日正式登陆 Hugging Face 社区,瞬间点燃了全球开发者和创意工作者的热情。这不仅仅是又一个开源工具的发布,更像是一次对现有图像编辑格局的强力挑战。

Mac 用户的本地 AI 助手Simular,安全高效再升级!

随着人工智能技术的快速发展,越来越多的 AI 工具开始融入用户的日常工作与生活中。近期,一款名为 Simular 的本地 AI 智能助手引起了广泛关注。这款专为 macOS 设计的 AI 工具以其独特的安全性、本地化处理和人机协作功能,为 Mac 用户带来了全新的生产力体验。创新的人机协作体验Simular 被定位为“全球首个人机协作的本地 AI 浏览器智能体”

阿里Qwen3-235B-A22B模型正式登陆HuggingChat

由阿里巴巴云开发的 Qwen3-235B-A22B 模型正式在 HuggingChat 平台上线。这一开源大型语言模型以其强大的推理能力、灵活的模式切换和高效的性能表现,迅速成为业界关注的焦点。通过整理 Twitter 上的最新信息,为您深入解析 Qwen3-235B-A22B 的技术亮点及其对开源 AI 生态的影响。

AI连镜头都不会看?别闹了!CameraBench 能直接给你上“电影课”

咱们天天聊 AI 多牛逼,能写诗、能画画、还能跟你唠嗑到天亮。但你有没有想过,当 AI 看视频的时候,它真的“看懂”了吗?你可能会说:“当然了,都能识别猫猫狗狗、人山人海了!”打住!识别物体是一回事,但理解视频的 “灵魂” —— 也就是 摄像机是怎么动的 —— 那又是另一回事了!想象一下,你看希区柯克的电影,那经典的“滑动变焦”(dolly zoom)带来的眩晕感

F-Lite登陆Hugging Face,10亿参数扩散变换器革新文本到图像生成

Hugging Face平台正式上线F-Lite,一款拥有10亿参数的文本到图像扩散变换器(Diffusion Transformer)。据了解,F-Lite以其高效的生成能力和轻量化设计,迅速成为AI图像生成领域的焦点,社交平台上的讨论凸显其对开发者与创作者的吸引力。相关细节已通过Hugging Face官网(huggingface.co)与社区公开。