ChatGPT回答编程问题的准确率比抛硬币还要差

2023-08-08 18:57:24 出处：站长之家

(资料图)

本文概要:

1. 普渡大学研究发现，ChatGPT 在软件编程问题上的准确率不到五成。

2. ChatGPT 的答案虽然经常是错误的，但由于其全面性和清晰的语言风格，仍然具有欺骗性。

3. ChatGPT 的答案更容易犯概念错误，php但在情绪表达上比 Stack Overflow 的答案更积极。

编程客栈（）8月8日消息:根据普渡大学的一项研究，OpenAI 的聊天机器人 ChatGPT 在超过一半的时间里对软件编程问题给出了错误的答案。

该研究分析了 ChatGPT 对517个 Stack Overflow 的问题的回答，以评估 ChatGPT 答案的正确性、一致性、全面性和简洁性。结果发现，52% ChatGPT 给出的答案是错误的，77% 的答案是冗长的。

值得注意的是，ChatGPT 的全面性和清晰的语言风格使其仍然具有欺骗性。研究人员表示，当错误不易验证或js需要外部 IDE 或文档时，参与者往往无法识别错误或低估答案中的错误程度php。由于其全面性和清晰的语言风格，ChatGPT 答案在39.34% 的情况下仍然受到青睐。

该论文指出，即使答案存在明显错误，12名参与者中仍有两人仍将首选答案标记为首选。论文将此归因于 ChatGPT 令人愉快、权威的风格。

此外，研究还发现 ChatGPT 的答案更容易犯概念错误，但在情绪表达上比 Stack Overflow 的答案更积极。

关键词：

理财更多>>

投资更多>>

论坛更多>>

收评：沪指震荡调整跌0.25% 两市成交金额跌破8000亿 【财华社讯】蔚来-SW(09866 HK)截至15:39下跌4 95%，现报113 4港元，跌

上市公司更多>>

桂华皎洁河山咸宁 | 原创歌曲《咸宁行》发布 “行”字一语三关，既是致敬《短歌行》《长歌行》的一种文体，又发出了

消费

产业

南微医学持续加强市场推广，上半年归母净利同比增加111.69% 松果财经消息，南微医学（SH688029）8月7日晚间发布半年度业绩报告称，

《荒野大镖客：救赎》PS4和Switch分辨率、帧数分析 《荒野大镖客：救赎》近日由R星官宣游戏将会上线PS4和任天堂Switch平台

齐家文化出土的铜镜，照见了4000年前的古人 以铜为镜，可以正衣冠。铜镜最早出现于新石器时代的齐家文化，在长

凉拌金针菇用什么菜最好吃饭店的凉拌菜为啥好吃 凉拌金针菇用什么菜最好吃饭店的凉拌菜为啥好吃大家好，我是第一美食的

基金

沪深交易所发布上市公司信披评价指引 《评价指引》积极引导上市公司采取切实有效措施提升投资者获得感和满意