5000字爆肝测评!六月AI资讯及实用测评合集
北京/设计爱好者/1年前/6226浏览
版权
5000字爆肝测评!六月AI资讯及实用测评合集
前言
在过去的30天里,AI圈又发生了哪些劲爆大事件?赶紧来看看我们精心整理的一手AIGC资讯和深度分析测评,我们的AIGC爆肝30天测评又和大家见面了。
继前两期AIGC测评文章发布之后,我们也收到了许多积极的反馈,对于还未阅读过的同学,欢迎通过以下链接直接访问浏览。
文章指路:
在本系列的第一章,我们还是会快速给大家概述下国内外AI圈领域的重要资讯和动态,第二章,除了既往介绍我们筛选后的重点实测产品以外,我们还将探讨和分析一些感兴趣的AI特定领域内容或者工具的对比研究,第二章会给大家详细介绍以下三个领域内容,首先是GPT-4o的功能详解,OpenAI的扩张之路以及国内外AI大模型的未来趋势等;其次是“苹果智能”套件Apple Intelligence的功能亮点介绍,最后是对AI智能海报平台的深入研究和测评。
接下来,就让我们来看看近期AIGC圈子里发生的最新进展吧!
第一章:近期AI圈大事件汇总
在本章中,我们将带您快速浏览AI圈近期发生的重要动态。为了确保信息的清晰度和易于消化,我们将这些事件按照国内和国际两个维度进行分类,并依次进行梳理。整体顺序为采集时随机排列,排名不分先后。
第1节. 国内篇
第2节. 国外篇
第二章:近期重点AI产品实测
第1节. GPT-4o
介绍概览
产品实测
Gpt-4o是一款由OpenAI开发的全新AI大模型,涵盖了文本、视频和音频领域的智能应用,我们将为大家详细介绍它的特点和应用场景。
首先,我们来看看GPT-4o与之前版本的区别。GPT-4o于2024年5月14日发布,是一个跨文本、视频和音频领域的综合AI模型。通过下方的表格我们可以看到,与OpenAI之前发布的GPT-4.0和GPT 4.0-Turbo相比,GPT-4o全面免费开放使用,大大降低了使用门槛;与此同时,它的主要优点表现在更快速、更智能、以及更强大,接下来,我们开一一展开说明。
更快速的响应速度
Current Time 0:00
/
Duration Time 0:00
Progress: NaN%
Playback Rate
1.00x
GPT-4o在响应速度上有了显著提升。通过摄像头和麦克风等设备,它能够实时获取图像和声音信息,并在毫秒级别进行处理和反馈。例如,这个例子显示出,它可以为视障人士提供实时的环境描述服务,充当他们的“眼睛”。此外,GPT-4o在回答问题时非常迅速,平均响应时间仅为232毫秒(人类对话的平均反应速度是320毫秒),让用户体验更加流畅。
更智能的情感交互
Current Time 0:00
/
Duration Time 0:00
Progress: NaN%
Playback Rate
1.00x
GPT-4o不仅速度快,还更加智能。它具备模拟和理解人类情感的能力,能够在情感层面与用户互动。这意味着在与用户交流时,它可以实时读懂并回应情绪。例如,在识别实时场景后,它可以为用户唱生日歌,情感丰富、声情并茂。此外,它对非英语类语言的理解和运用能力也有了显著提升,能够流畅地进行多语言互动。
更强大的设备集成
Current Time 0:00
/
Duration Time 0:00
Progress: NaN%
Playback Rate
1.00x
GPT-4o首次推出了电脑客户端,实现了与用户电子设备的深度融合。这不仅使其不再局限于网页版,还能够直接处理用户电脑上的网页信息、办公内容和随时提出的问题。比如,在办公场景中,它可以循循善诱地教学数学题,抑或主持多人会议并记录会议备忘。
2024年高考实测
另一个实测案例也非常有趣。在今年高考落幕后,上海人工智能实验室使用其司南评测体系OpenCompass,选取GPT-4o和其他6个开源模型,进行高考“语数外”全卷能力测试。
在这场测试中,GPT-4o获得了第二名的成绩。得分情况显示,GPT-4o在语文和英语方面成绩突出,尤其是对语文的现代文理解能力较强,而英语则存在因为作文超出字数限制而扣分的情况,和人类考生往往因为字数不足而扣分的情况相反;但在数学方面还存在一定的挑战,和其它大模型一样没有及格,测试显示出,这些大模型在数学主观题回答普遍比较凌乱,甚至出现过程错误但结果正确的情况。这次高考测试显示了GPT-4o在语言理解和生成方面的强大能力,同时也指出了AI在数学推理领域的改进空间。
OpenAI与传媒界的博弈
作为一颗在人工智能领域冉冉升起的新星,OpenAI面对的挑战与争议从未停歇。一直以来,AI公司们在训练AI模型时非法使用新闻内容的举动引发了新闻业的担忧与抗议,以《纽约时报》为代表的多家新闻机构正在向OpenAI提起诉讼,指控其AI工具侵犯版权。但与此同时,OpenAI也在想方设法改变自己的处境,积极探寻扩张之路。
5月22日,OpenAI宣布和新闻集团(News Corp)宣布达成多年期协议,OpenAI将可以访问新闻集团主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《纽约邮报》《泰晤士报》《太阳报》等在内的众多媒体。
OpenAI有权在ChatGPT中显示新闻集团旗下媒体的内容,来回答用户的问题,增强其产品能力;除了提供内容外,新闻集团还将分享新闻专业知识,以帮助确保在OpenAI的产品中达到最高的新闻标准。两家公司并未透露签约此次协议的具体金额。不过据外媒报道,新闻集团将在五年内获得OpenAI支付的2.5亿美元,其中包括现金和使用OpenAI技术的信用额度。
越来越多的媒体公司和机构“牵手”OpenAI,授权后者使用其资料库来训练AI模型。今年以来,OpenAI已经与美国、英国、德国、法国、西班牙等国家的媒体达成了协议。当然,OpenAI需要给这些公司或机构支付不菲的授权费用。
OpenAI与Apple的联手
在与传媒界周旋的同时,OpenAI也在为自身应用的落地载体开辟更广阔的道路。
6月11日,OpenAI与苹果官宣合作。ChatGPT将被深度集成在苹果产品矩阵中,包括最新的iOS、iPadOS和macOS。用户无需在工具之间跳转即可访问 ChatGPT,包括图像和文档理解功能。
Siri 也可以随时利用 ChatGPT 的专业回答。此外,Apple系统范围内的写作工具也可以用到 ChatGPT,从而帮助用户生成内容。通过 Compose,用户也可以访问 ChatGPT 图像工具来生成各种风格的图像。
OpenAI的竞品动态:微软
市场上的竞争者也在积极推进他们的AI产品。例如,5月21日,微软发布了搭载Windows 11版本的Surface Pro 10和Surface Laptop 6,集成了Bing Chat和GPT-4的Copilot功能,它们成为微软首批AIPC产品,性能与效率可媲美苹果iPad Pro、MacBook Pro。
Windows 11更新版推出了AI功能,对一些操作系统中的基础功能进行AI升级,包括画图(Point)、视频编辑器(Clichamp)、截图工具(Snipping Tool)和照片、实时字幕和翻译功能,以及一项微软内部称之为“AI Explorer”的新功能。
“AI Explorer”被看作是一个“升级版Copilot”,内置历史/时间轴功能,用户在电脑上所有活动都将转化为可以用自然语言搜索的时刻(moment)。该功能适用于所有应用程序,用户可以通过该功能直接搜索之前打开的对话、文档、网页与图片。例如,用户可以输入“找一下上次李梅说她喜欢哪些餐厅”,AI Explorer就会显示出李梅之前提到这些餐厅时的确切对话。
第2节. Apple Intelligence
介绍概览
产品实测
面对来势汹汹的微软、OpenAI和谷歌——这些已在人工智能领域崭露头角的对手,苹果也奋起直追。北京时间6月11日,苹果WWDC2024发布会终于揭开面纱。除了常规的系统更新外,传闻已久的“Apple Intelligence”——“苹果智能”套件,以及与OpenAI的合作也终于在世人面前亮相。
根据发布会介绍,Apple Intelligence是苹果的全新个性化智能系统,全面接入了生成式AI的能力。Apple Intelligence结合生成式AI模型和使用者的个人资料,提供实用的智能服务。它覆盖iPhone、iPad和Mac,深度集成在iOS 18、iPadOS18和macOS Sequoia中。它利用苹果芯片的能力来理解并创造语言和图像,可以跨应用地执行操作,并利用个人信息简化和加速日常任务。
由于发布会的信息内容量比较大,在此我们为大家简单总结一下本次苹果发布会关于Apple Intelligence的主要功能。
1.
脱胎换骨的Siri
a. 更丰富的语言理解能力,变得更加自然、更懂上下文、更个性化,能够简化和加速日常任务;
b. 能够理解用户在说话时的犹豫,并在不同请求之间保持上下文连贯;
c. 支持打字与Sir交流,并可以在文本和语音之间切换;
d. 全新的设计,当Siri处于激活状态时,屏幕边缘会环绕着优雅的发光效果。
2.
更强的语言理解和创造能力
a. 全新的系统级写作工具支持在任何写作场合重写、校对和总结文本,包括邮件、备忘录、页面以及第三方应用程序
b. 重写功能:用户可以从多个版本中挑选,调整文风以适应不同的读者和场合;
c. 校对功能:深入检查语法、词汇和句式结构,并提供建议性的编辑意见及其解释,让用户轻松审查或快速采纳;
d. 总结功能:允许用户选取文本,一键生成简洁明了的段落、要点列表、表格或清单,使信息一目了然。
3.
更自由的可视化表达
a. 更便捷的照片和视频搜索能力:用户可以使用自然语言直接搜索特定照片;
b. 更强大的视频剪辑能力:用户能够在剪辑中找到特定时刻,并直接跳到相关片段。此外,全新的「Clean Up」工具可以识别并移除照片背景中的干扰物体,而不会改变主体;
c. Image Playground应用:用户可以在几秒钟内创建动画、插图或素描三种风格的图像。用户还可以通过Apple Pencil工具调板中的新Image Wand访问Image Playground,使笔记更具视觉吸引力。粗略的草图可以变成令人愉悦的图像,用户甚至可以选择空白空间,利用周围区域的背景来创建图像;
d. Genmoji:苹果系统将支持创建原创的Genmoji来表达想法,只需输入描述,符合要求的Genmoji就会出现,并附带其他选项。用户甚至可以根据照片为朋友和家人创建 Genmoji。就像表情符号一样,Genmoji 可以内嵌添加到消息中,也可以作为贴纸进行分享。
以上就是本次苹果发布会中有关Apple Intelligence的主要亮点。发布会结束的当天,苹果股价下跌1.91%,然而第二天,苹果股价大涨7.26%,市值大增2142亿美元,创下历史新高,近期股价最高曾达220.2美元。由此可见,市场对苹果还是抱有较乐观的期望的。
第3节. AI智能海报平台
介绍概览
AIGC最近已经渗透到工作中的各个方面,以工作中常见的海报制作为例,有哪些AI能力介入?最终呈现效果如何?接下来让我们从“可画”这个业界翘楚的使用中一探究竟。
产品实测
首先,基于设计主题检索和确定要使用的海报模板。下图以母亲节为例——在检索框输入“母亲节”,即可在诸多的主题海报中找到心仪的模板。
其次,为了和竞品海报拉开差异以及彰显个性化,用户会替换模板中的主体素材。在AI出现之前,我们除了导入版权素材,就只能自行设计;在AI出现之后,我们可以输入提示词,让AI来生成图片素材。像使用Midjourney一样,不满意就重新生成,直到选出满意的生成效果为止。
再者,对主体素材可以做进一步的调整,如AI抠图、加各种滤镜等。主画面完成后,需要精准控制的logo、文案、二维码等元素,可以直接进行替换并调整大小、位置、字号、字色等。
最后,一个正常的海报制作就基本完成了。可画对于文案部分,也引入了AI功能——魔力快写,让用户可以对现有文本进行续写、缩写、重写等。
产品评价
可画是一个平台级产品,涵盖了各种规格的设计物料制作,此处我们以海报制作为例,管中窥豹,旨在分析现阶段AI在设计实操上的表现,一句话概括就是——现阶段对于海报设计,AI还不能一步到位直接生成海报结果,而是把细碎的AI能力穿插在图片生成、图片处理、文案处理等不同阶段。同样,国内同类竞品稿定(www.gaoding.com)也是一样的解题思路,因为稿定的AI能力和实际效果与可画大致相同,就不再赘述,感兴趣的童鞋可以自行体验。
然后以可画为代表的AI智能海报平台具体效果如何?我们分别来看:1.AI生图——效果一般,不及MIdjourney,推测是只能选择国内过审的文生图模型;无法添加各自定制化的Lora,如各自吉祥物Lora模型;2.AI修图——有的不错,有的不行。和世面上的现状大差不差,抠图、变高清、去水印等效果不错;局部重绘和扩图等功能就很拉胯;3.AI文案——比一般人能写,能力不及编辑。综上,现在的AI智能海报平台最拿手的还是基于海量模板,给非设计类人员用比较出色。基于AI能力做定制画海报,还需要让子弹再飞一会儿。
结语
以上就是本次AIGC测评的全部内容了,希望除了快速了解AI圈的大事件以外,还希望能够为同学们带来一些启发和新思路。如果本期的内容大家还没有看过瘾的话,一定要继续关注我们,我们会持续追踪AIGC的最新进展并在第一时间发布独家深度测评,大家的关注和互动会是我们持续更新的动力。同学们,我们下期见!
66
Report
声明
123
Share
相关推荐
in to comment
Add emoji
喜欢TA的作品吗?喜欢就快来夸夸TA吧!
You may like
相关收藏夹
Log in
66Log in and synchronize recommended records
99+Log in and add to My Favorites
评论Log in and comment your thoughts
分享Share




































































































