首页>财经 > 正文

ChatGPT回答编程问题的准确率比抛硬币还要差

2023-08-08 18:57:24    出处:站长之家


(资料图)

本文概要:

1. 普渡大学研究发现,ChatGPT 在软件编程问题上的准确率不到五成。

2. ChatGPT 的答案虽然经常是错误的,但由于其全面性和清晰的语言风格,仍然具有欺骗性。

3. ChatGPT 的答案更容易犯概念错误,php但在情绪表达上比 Stack Overflow 的答案更积极。

编程客栈()8月8日 消息:根据普渡大学的一项研究,OpenAI 的聊天机器人 ChatGPT 在超过一半的时间里对软件编程问题给出了错误的答案。

该研究分析了 ChatGPT 对517个 Stack Overflow 的问题的回答,以评估 ChatGPT 答案的正确性、一致性、全面性和简洁性。结果发现,52% ChatGPT 给出的答案是错误的,77% 的答案是冗长的。

值得注意的是,ChatGPT 的全面性和清晰的语言风格使其仍然具有欺骗性。研究人员表示,当错误不易验证或js需要外部 IDE 或文档时,参与者往往无法识别错误或低估答案中的错误程度php。由于其全面性和清晰的语言风格,ChatGPT 答案在39.34% 的情况下仍然受到青睐。

该论文指出,即使答案存在明显错误,12名参与者中仍有两人仍将首选答案标记为首选。论文将此归因于 ChatGPT 令人愉快、权威的风格。

此外,研究还发现 ChatGPT 的答案更容易犯概念错误,但在情绪表达上比 Stack Overflow 的答案更积极。

关键词:

消费
产业
南微医学持续加强市场推广,上半年归母净利同比增加111.69% 松果财经消息,南微医学(SH688029)8月7日晚间发布半年度业绩报告称,
《荒野大镖客:救赎》PS4和Switch分辨率、帧数分析 《荒野大镖客:救赎》近日由R星官宣游戏将会上线PS4和任天堂Switch平台
齐家文化出土的铜镜,照见了4000年前的古人 以铜为镜,可以正衣冠。铜镜最早出现于新石器时代的齐家文化,在长
凉拌金针菇用什么菜最好吃 饭店的凉拌菜为啥好吃 凉拌金针菇用什么菜最好吃饭店的凉拌菜为啥好吃大家好,我是第一美食的
基金