港股收评:中东战火+美联储鹰派双杀!恒指暴跌超500点,石油煤炭逆势上涨
据了解,Sam Altman 刚接受采访表示,GPT-6已经在路上,而且节奏会比 GPT-4 到 GPT-5 的间隔更快。
GPT-6已经着手研发
Sam强调,GPT-6最重要的产品方向之一,面向的是长期个性化体验,日程规律,常用工具链,用户可定义语气与人格,不只是热情或冷静这类简单开关,还包括更强的可塑性,更像个人化助手。
当前,在AI技术浪潮下,企业的边界和核心竞争力正在被重新定义。2025年被业内人士普遍视为“AI应用商业化元年”,而AI多模态技术正是这一趋势的核心驱动力,数字人直播、金融分析等等场景已经有多模态大模型应用其中。
与此同时,市场竞争压力逐渐加剧,各大模型厂商也在密集布局,从视觉理解到全模态交互,多模态大模型在2025年明显迭代加速,再为AGI大模型赛道添了一把火。
科技厂商密集布局
苹果(AAPL.US)
据苹果知名爆料人马克·古尔曼透露,苹果公司已经组建了一支名为“Answers,Knowledge and Information”的新团队。
苹果称,该团队正在研发自家的“答案引擎”,这是一种能够以对话形式直接提供答案的AI搜索技术,类似于ChatGPT。它既可以作为独立应用使用,也能为Siri、Spotlight以及Safari等苹果产品提供增强搜索功能。
在苹果组建新团队、表态AI战略的同时,专业人士观点认为,AKI团队的成立,是苹果迄今为止对抗ChatGPT和谷歌Gemini的最直接举措,也标志着公司AI战略的调整。
Meta(META.US)
继Meta持续发力,大肆网罗人才、收购企业,在行业内掀起一阵波澜后,扎克伯格计划采取进一步行动,这可能会加剧AI技术领域的内部改革。
知情人士透露,Meta 预计将于周二宣布将其人工智能部门 —— 即 Meta 超级智能实验室 —— 拆分为四个小组。知情人士称,这些举措旨在更好地整合 Meta 的资源,使其能更快地开发人工智能产品,以与其他企业竞争。
今年 6 月,在 Meta 难以推进其最新人工智能模型研发后,扎克伯格的决心愈发明显。当月,Meta 宣布成立超级智能实验室,专门致力于打造一款比人类大脑更强大的人工智能。
如今,Meta希望重新开始改变AI部门运营策略,先靠“砸钱”紧急弥补短板,甚至将AI部门进行全面重组,成立“超级智能实验室”,该部门将致力于开发超越人类能力的AI系统,其研发方向也将直接影响XR产品的多模态升级。
英伟达(NVDA.US)
当全球几乎所有大型科技公司都将自己的AI未来押注在英伟达的平台上时,从H100到最新的Blackwell平台,英伟达正以风驰电掣的速度向前飞奔。英伟达不仅提供性能强大的芯片,更重要的是,它提供的是一整套解决方案,背后是其经营了近二十年的无形壁垒——CUDA软件生态。
据悉,CUDA,这个英伟达推出的并行计算平台和编程模型,经过近二十年的积累,已经成为AI开发领域的Windows操作系统。全球数百万的AI开发者,都已经习惯于在这个平台上进行工作。
阿里巴巴(BABA.US)
8月19日,阿里通义团队推出Qwen-Image-Edit,基于20B参数的Qwen-Image,专注于语义和外观编辑,支持双语文本修改、风格迁移及物体旋转,进一步拓展了生成式AI在专业内容创作中的应用。
此外,Qwen-Image-Edit将输入图像同时输入到Qwen2.5-VL和VAE Encoder,从而兼具语义与外观的双重编辑能力,尤其适合需要高精度文本修改和创意设计的场景,可以进一步降低专业图像创作门槛。短短半年内,阿里连续推出Qwen2.5-VL、Qwen2.5-Omni、Qwen-Image等多模态模型。
微美全息(WIMI.US)
据悉,微美全息作为AI领域的代表性企业,围绕多模态AI技术落地与硬件+软件协同创新展开布局,通过自研+开源双轨模式构建技术壁垒,重点布局文本、图像、音频、视频原生级融合的多模态模型,旨在提供实时多模态AI模型体验。
目前,微美全息旗下平台支持动态实时渲染技术,通过AI视觉算法提升环境感知、实时翻译及手势识别能力,推动虚实交互向自然化、智能化发展。同时在内容创作、商业服务、教育普惠等领域构建应用生态,例如微美全息通过全息AR技术与AI多模态交互结合,打造沉浸式教学、虚拟会展等创新场景。
结语
根据研究报告显示,预计至2025年,全球多模态AI市场规模将飙升至24亿美元,而到2037年底,这一数字更是预计将达到惊人的989亿美元。而业内普遍认为,随着技术不断成熟和生态持续完善,多模态能力将成为AGI系统的标配,而将也是产业界下一步需要重点探索的方向。
GPT-6已经着手研发
Sam强调,GPT-6最重要的产品方向之一,面向的是长期个性化体验,日程规律,常用工具链,用户可定义语气与人格,不只是热情或冷静这类简单开关,还包括更强的可塑性,更像个人化助手。
当前,在AI技术浪潮下,企业的边界和核心竞争力正在被重新定义。2025年被业内人士普遍视为“AI应用商业化元年”,而AI多模态技术正是这一趋势的核心驱动力,数字人直播、金融分析等等场景已经有多模态大模型应用其中。
与此同时,市场竞争压力逐渐加剧,各大模型厂商也在密集布局,从视觉理解到全模态交互,多模态大模型在2025年明显迭代加速,再为AGI大模型赛道添了一把火。
科技厂商密集布局
苹果(AAPL.US)
据苹果知名爆料人马克·古尔曼透露,苹果公司已经组建了一支名为“Answers,Knowledge and Information”的新团队。
苹果称,该团队正在研发自家的“答案引擎”,这是一种能够以对话形式直接提供答案的AI搜索技术,类似于ChatGPT。它既可以作为独立应用使用,也能为Siri、Spotlight以及Safari等苹果产品提供增强搜索功能。
在苹果组建新团队、表态AI战略的同时,专业人士观点认为,AKI团队的成立,是苹果迄今为止对抗ChatGPT和谷歌Gemini的最直接举措,也标志着公司AI战略的调整。
Meta(META.US)
继Meta持续发力,大肆网罗人才、收购企业,在行业内掀起一阵波澜后,扎克伯格计划采取进一步行动,这可能会加剧AI技术领域的内部改革。
知情人士透露,Meta 预计将于周二宣布将其人工智能部门 —— 即 Meta 超级智能实验室 —— 拆分为四个小组。知情人士称,这些举措旨在更好地整合 Meta 的资源,使其能更快地开发人工智能产品,以与其他企业竞争。
今年 6 月,在 Meta 难以推进其最新人工智能模型研发后,扎克伯格的决心愈发明显。当月,Meta 宣布成立超级智能实验室,专门致力于打造一款比人类大脑更强大的人工智能。
如今,Meta希望重新开始改变AI部门运营策略,先靠“砸钱”紧急弥补短板,甚至将AI部门进行全面重组,成立“超级智能实验室”,该部门将致力于开发超越人类能力的AI系统,其研发方向也将直接影响XR产品的多模态升级。
英伟达(NVDA.US)
当全球几乎所有大型科技公司都将自己的AI未来押注在英伟达的平台上时,从H100到最新的Blackwell平台,英伟达正以风驰电掣的速度向前飞奔。英伟达不仅提供性能强大的芯片,更重要的是,它提供的是一整套解决方案,背后是其经营了近二十年的无形壁垒——CUDA软件生态。
据悉,CUDA,这个英伟达推出的并行计算平台和编程模型,经过近二十年的积累,已经成为AI开发领域的Windows操作系统。全球数百万的AI开发者,都已经习惯于在这个平台上进行工作。
阿里巴巴(BABA.US)
8月19日,阿里通义团队推出Qwen-Image-Edit,基于20B参数的Qwen-Image,专注于语义和外观编辑,支持双语文本修改、风格迁移及物体旋转,进一步拓展了生成式AI在专业内容创作中的应用。
此外,Qwen-Image-Edit将输入图像同时输入到Qwen2.5-VL和VAE Encoder,从而兼具语义与外观的双重编辑能力,尤其适合需要高精度文本修改和创意设计的场景,可以进一步降低专业图像创作门槛。短短半年内,阿里连续推出Qwen2.5-VL、Qwen2.5-Omni、Qwen-Image等多模态模型。
微美全息(WIMI.US)
据悉,微美全息作为AI领域的代表性企业,围绕多模态AI技术落地与硬件+软件协同创新展开布局,通过自研+开源双轨模式构建技术壁垒,重点布局文本、图像、音频、视频原生级融合的多模态模型,旨在提供实时多模态AI模型体验。
目前,微美全息旗下平台支持动态实时渲染技术,通过AI视觉算法提升环境感知、实时翻译及手势识别能力,推动虚实交互向自然化、智能化发展。同时在内容创作、商业服务、教育普惠等领域构建应用生态,例如微美全息通过全息AR技术与AI多模态交互结合,打造沉浸式教学、虚拟会展等创新场景。
结语
根据研究报告显示,预计至2025年,全球多模态AI市场规模将飙升至24亿美元,而到2037年底,这一数字更是预计将达到惊人的989亿美元。而业内普遍认为,随着技术不断成熟和生态持续完善,多模态能力将成为AGI系统的标配,而将也是产业界下一步需要重点探索的方向。
