图片-精准获客

ChatGPT已正式上线GPT – 4.1

刚刚,OpenAI正式宣布:从今天起,GPT – 4.1可直接在ChatGPT中使用。

该模型在编码任务和遵循指令方面表现出色,是o3和o4 – mini的理想替代方案。

图片[1]-ChatGPT已正式上线GPT – 4.1-精准获客

一个月前,GPT – 4.1刚推出时,仅通过API向开发者开放,如今在ChatGPT中就能直接使用了。

其中,Plus、Pro和Team用户可通过模型选择器中的「更多模型」下拉菜单访问GPT – 4.1,企业版和教育版用户将在未来几周内获得访问权限。

OpenAI表示,还会在ChatGPT中为所有用户引入GPT – 4.1 mini来替代GPT – 4o mini。

图片[2]-ChatGPT已正式上线GPT – 4.1-精准获客

凭借超长的上下文能力,现在可以将整段代码放入GPT – 4.1进行分析。

图片[3]-ChatGPT已正式上线GPT – 4.1-精准获客

GPT – 4.1和GPT – 4.1 mini均已通过OpenAI的最新标准安全评估。

在以下两项评估中,GPT – 4.1排名靠前:

  • not_unsafe:依据OpenAI政策和模型规范,检查模型是否未产生不安全输出。
  • not_overrefuse:检查模型是否遵循良性请求。

在幻觉评估和指令遵循方面,GPT – 4.1表现优异,但在越狱评估方面表现欠佳。

图片[4]-ChatGPT已正式上线GPT – 4.1-精准获客

图片[5]-ChatGPT已正式上线GPT – 4.1-精准获客

图片[6]-ChatGPT已正式上线GPT – 4.1-精准获客

图片[7]-ChatGPT已正式上线GPT – 4.1-精准获客

图片[8]-ChatGPT已正式上线GPT – 4.1-精准获客

GPT – 4.1,比GPT – 4.5更好?

此次推出GPT – 4.1,也是对用户呼声的回应。

早在4月底,就有用户抱怨:GPT – 4.1是自己最喜欢的OpenAI模型,可惜在ChatGPT中无法使用。

图片[9]-ChatGPT已正式上线GPT – 4.1-精准获客

该用户笃定地表示:使用体验比GPT – 4.5还要好!

图片[10]-ChatGPT已正式上线GPT – 4.1-精准获客

不少开发者也现身说法,称除了GPT – 4.1的早期版本Quasar Alpha外,它是自己测试过的最佳编码模型。

越来越多人认为,GPT – 4.1是一个被低估的模型。

图片[11]-ChatGPT已正式上线GPT – 4.1-精准获客

上个月,OpenAI专为开发者推出了GPT – 4.1系列新模型,包括GPT – 4.1、GPT – 4.1 mini和GPT – 4.1 nano。

它们都拥有最高100万Token的超大上下文窗口,在代码处理、指令跟随等核心能力上全面超越GPT – 4o及GPT – 4o mini,且知识截止日期已更新至2024年6月。

图片[12]-ChatGPT已正式上线GPT – 4.1-精准获客

实测:顺利完成庞大代码任务

既然众多ChatGPT用户都能使用GPT – 4.1,网上已经涌现出不少实测案例。

比如沃顿商学院教授Ethan Mollick,用一道考验各大模型的景点难题来测试GPT – 4.1:「请创建一段我可以直接粘贴到p5.js中的代码,它要以惊人的巧思震撼我,仿佛是未来某艘星舰控制面板的呈现。」GPT – 4.1表现十分出色。

图片[13]-ChatGPT已正式上线GPT – 4.1-精准获客

另一位开发者实测后也倍感惊喜。当时他在处理一个代码量极大的任务,系统自动选择的模型无法处理,没有生成任何内容。而GPT – 4.1不仅比默认模型处理速度快,还准确完成了任务,甚至清理掉了整个文件中未使用的代码。

图片[14]-ChatGPT已正式上线GPT – 4.1-精准获客

实测发现,GPT – 4.1在代码生成速度上有了显著提升。例如,让它生成一个博客首页,几秒内就完成了输出。

图片[15]-ChatGPT已正式上线GPT – 4.1-精准获客

再如,让它用python编写一个地球飞往火星的动画,几乎瞬间就完成了输出。

图片[16]-ChatGPT已正式上线GPT – 4.1-精准获客

这只是第一轮交互的结果,能明显感受到GPT – 4.1的速度有了根本性提升。

图片[17]-ChatGPT已正式上线GPT – 4.1-精准获客

进一步挑战,让GPT – 4.1用动画解释量子纠缠,初步来看,它似乎理解了量子纠缠的概念。

图片[18]-ChatGPT已正式上线GPT – 4.1-精准获客

图片[19]-ChatGPT已正式上线GPT – 4.1-精准获客

在推理问题上,GPT – 4.1表现同样出色。比如多步骤的年龄计算问题,它的求解逻辑严谨。

图片[20]-ChatGPT已正式上线GPT – 4.1-精准获客

面对逆向思考、脑筋急转弯等问题,GPT – 4.1也能快速推理,得出的答案十分有趣。

图片[21]-ChatGPT已正式上线GPT – 4.1-精准获客

网友吐槽:没有1M上下文版本,令人失望!

然而,试用GPT – 4.1后,许多网友大失所望。

尽管OpenAI发布了GPT – 4.1,但没有包含100万上下文窗口的API版本。

图片[22]-ChatGPT已正式上线GPT – 4.1-精准获客

图片[23]-ChatGPT已正式上线GPT – 4.1-精准获客

大家希望在ChatGPT中使用GPT – 4.1,主要是看中其超长的上下文窗口。如今只能寄希望于GPT – 5能提供超长上下文窗口了。

图片[24]-ChatGPT已正式上线GPT – 4.1-精准获客

图片[25]-ChatGPT已正式上线GPT – 4.1-精准获客

实际上,不断有人发现,ChatGPT(Pro)中的GPT – 4.1最大上下文长度似乎仅为128k token,与API中的100万token相差甚远,这意味着OpenAI并未提高GPT – 4.1的限制。

图片[26]-ChatGPT已正式上线GPT – 4.1-精准获客

总之,这着实令人失望,看来只能转向Gemini了。

图片[27]-ChatGPT已正式上线GPT – 4.1-精准获客

也有网友发现了一个特殊情况:

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容