AI领域竞争白热化,苹果与微软分别推出创新模型TarFlow与Mu,前者革新图像生成技术,后者则以极小体量赋能Windows智能体。同时,AI的应用边界持续拓宽,从Grok进军电子表格编辑,到GPT-4助力癌症新药研发,再到ElevenLabs发布语音优先的AI助理。然而,行业发展也伴随着法律挑战,迪士尼已就版权问题向Midjourney等AI公司提起诉讼。此外,OpenAI与Jony Ive公司合作开发AI硬件的消息,预示着AI的下一战场可能转向实体设备。
苹果另辟蹊径 发布AI生图新模型TarFlow
苹果公司在AI图像生成领域展示了其独特的思考,发布了基于“归一化流”(Normalizing Flows)技术的全新模型TarFlow与STARFlow。与主流的扩散模型不同,TarFlow通过分块生成像素来保证高质量输出,避免了传统方法中可能出现的质量损失。其姊妹模型STARFlow则在潜空间中运行,并能调用外部大语言模型来更精准地理解和处理复杂的文本提示,显著提升了生成效率与图像质量。
微软发布3亿参数“微”模型Mu 专为Windows智能体打造
微软推出了一款参数仅为3.3亿的创新小型模型Mu,其性能却能与体量是其十倍的Phi-3.5-mini相媲美。该模型专为本地化部署而优化,在离线的NPU设备上能实现每秒超过100个token的惊人响应速度。Mu借鉴了Phi Silica架构,并引入双重层归一化、旋转位置嵌入等先进技术,使其能够通过自然语言指令直接操作Windows系统设置。经过大规模数据微调,Mu已将操作响应时间成功控制在500毫秒以内,极大地提升了Windows系统的易用性和智能化水平。
开源新星 OmniGen2 用自然语言“指点江山”精修图像
OmniGen2作为开源社区中Flux Context的有力替代者,为用户提供了强大的自然语言图像编辑能力。用户只需通过简单的文字指令,即可对图像进行精准的局部编辑,包括删除或替换对象、进行风格转换、调整颜色、处理背景、添加新物品,甚至修改人物的表情和动作。目前,该模型的权重已在Hugging Face Space上公开发布,供广大开发者和爱好者体验。
版权保卫战打响 迪士尼正式起诉Midjourney
随着AI生成内容的普及,版权问题日益凸显。娱乐巨头迪士尼已采取法律行动,正式起诉Midjourney等AI公司,指控其未经许可使用迪士尼的知识产权进行模型训练和图像生成。此举标志着内容创作者与AI技术公司之间的法律战火正在升级。在积极维权的同时,迪士尼也在与OpenAI等公司进行合作洽谈,旨在探索在保护自身版权角色和IP的同时,利用AI技术发展的可能性。
法庭文件曝光 OpenAI联手苹果前设计总监Jony Ive秘密研发AI硬件
一则法庭文件意外揭示,OpenAI正与苹果公司的前首席设计官Jony Ive创办的设计公司io进行深度合作,共同为一款面向大众市场的AI硬件设备进行技术研发。这一消息源于io公司针对另一家初创公司iyO提起的商标纠纷诉讼。此次合作曝光,意味着OpenAI的野心已不止于软件层面,正试图将AI能力封装到专门的硬件中,这可能预示着下一代消费级智能设备的到来。
Grok亮剑生产力工具 挑战微软与谷歌的电子表格霸权
根据最新泄露的信息,马斯克旗下的xAI公司正为Grok开发一项强大的新功能——支持电子表格的高级文件编辑器。此举旨在将Grok这一强大的AI助手深度集成到日常的生产力工具中,直接向微软的Excel和谷歌的Sheets等传统办公软件发起挑战。通过赋能电子表格处理能力,Grok希望在AI驱动的生产力赛道上与OpenAI、Google和Microsoft展开激烈竞争。

AI成抗癌新希望 GPT-4成功发现乳腺癌协同治疗新方案
剑桥大学等研究机构的一项突破性研究显示,大型语言模型在攻克癌症方面展现出巨大潜力。研究人员利用GPT-4分析海量医学文献和数据,成功提出了一种全新的乳腺癌协同治疗方案。该方案创新性地组合了辛伐他汀和双硫仑等非传统抗癌药物,并通过实验验证了其有效性。这一成果为利用AI进行新药研发开辟了全新路径,展示了AI“发明”新疗法的可能性。
苹果收购版图再添变数 与Mira Murati新公司谈判破裂
据报道,苹果公司此前曾与前OpenAI首席技术官Mira Murati创立的人工智能公司Thinking Machines Lab进行过收购洽谈。这家新公司的估值高达100亿美元,致力于使AI系统更易于被人类理解和定制。然而,最新的消息显示,双方的谈判并未达成协议,最终以破裂告终。目前,苹果公司正将评估的目光转向另一家AI搜索公司Perplexity,其在AI领域的布局策略依然充满变数。
4K画质一键达成 Astra为AI视频创作者推出超分辨率工具
一款名为Astra的专业级AI视频超分辨率工具正式上线。该工具利用先进的AI技术,能够智能地将低分辨率的视频素材提升至清晰的4K画质,旨在解决AI视频创作者在内容生产最后环节的画质难题。尽管其功能相对单一,且标准版月费为39美元(约合人民币280元),价格不菲,但它为追求极致画质的用户提供了一个有效的解决方案。
ElevenLabs发布语音优先AI助理11ai 支持超5000种声音
以语音技术闻名的ElevenLabs公司发布了其全新的AI个人助理——11ai。这款助理主打“语音优先”的交互体验,并集成了强大的多工具集成能力和自定义MCP支持,允许用户创建高度个性化的工作流程。11ai具备日程管理、实时搜索和团队协作等核心生产力功能,支持超过5000种声音和70多种语言,其强大的多模态交互能力使其成为提升全球用户工作效率的强大工具。
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译
评论 (0)
暂无评论,快来发表第一条评论吧!