ChatGPT在美国最高法院测试中表现不佳

mimmita1 發表於 2023-12-27 13:34:19

本帖最後由 mimmita1 於 2023-12-27 13:47 編輯

ChatGPT （聊天生成预训练变压器）是一个由人工智能 (AI) 支持的程序，旨在取代审判中的律师和法官，但在 SCOTUSblog（一个专门报道聊天内容的网站）进行的测试中表现不佳。美国最高法院。

再生产
再生产
为了测试 ChatGPT，并了解法律从业者是否需要担心这项新技术，SCOTUSblog 的编辑准备了一份有关最高法院的 50 个问题清单。ChatGPT 正确回答了 22 个问题（表中绿色），错误回答了 25 个问题（红色），并对 3 个问题给出了不完整甚至误导性的答案（黄色）——换句话说，它的表现还不到 50%。

[在右栏中，SCOTUSblog 编辑解释了错误的答案。]

在一些查明有关最高法院判决、程序、学说和历史的问题中，ChatGPT 犯了严重错误，也犯了一些不太严重的错误。

例如，当被问及前总统唐纳德·特朗普任命了多少名法官时（问题 35），ChatGPT 回答“两名——尼尔·戈萨奇和布雷特·卡瓦诺”。你没有提到艾米·巴雷特。编辑们向他询问有关部长的问题，他纠正了自己。

在关于前部长露丝·巴德·金斯伯格 (Ruth Bader Ginsburg, RBG) 的三张值得注意的投票的问题 (11) 中，ChatGPT 正确识别并总结了两票，但错误地回答说她在奥伯格费尔诉金斯堡案中写了反对票。霍奇斯，同性婚姻合法化的决定。根据 ChatGPT 的说法，她会写道，法院应将这一决定留给各州。但事实上，RBG 以多数票支持同性婚姻。

对于 SCOTUSblog 的编辑来说，这个简单的历史事实问电报号码数据题的正确答案很容易在其他来源中找到，例如维基百科和谷歌。因此，他们开始了另一场会议，特别询问 RBG 是否撰写了对同性婚姻决定的反对票。ChatGPT 再次答错，并给出了不合理的解释。

在关于法院“CVSG”行话的问题（18）中，ChatGPT 正确地写道，它的意思是“征求副检察长的意见”（请求联邦政府提供意见）。但他错误地表示，当政府参与这一进程时，这一点就适用。事实上，法院只是在某些联邦政府不是当事方的案件中征求工会总检察长的意见。

在关于除法院最新部长之外的职责的问题（45）中，ChatGPT 列出了一份任务清单，所有这些任务都是错误的（包括副部长负责维护法院大楼）。法官埃琳娜·卡根(Elena Kagan)描述了“初级”部长的额外职责：在部长私人会议期间做笔记，在会议期间应门，以及在“自助餐厅委员会”任职。

在关于弹劾部长的问题（49）中，他正确地回答了众议院于 1804 年批准了对前部长塞缪尔·蔡斯的弹劾，但在 1933 年发明了对詹姆斯·F·韦斯特的弹劾。 1933 年，詹姆斯·F·韦斯特 (James F. West) 从未担任过最高法院法官。

ChatGPT也犯了一些小错误，正确回答了一些问题，但在一两个细节上感到困惑。例如，对于问题 28，他给出了正确答案，告知最高法院第一位为案件辩护的女性是律师贝尔瓦·安·洛克伍德 (Belva Ann Lockwood)。但他弄错了年份：他引用的是 1879 年，而实际上是 1880 年。

http://zh-cn.bhlists.com/wp-content/uploads/2023/12/Telegram-Number-Data-3.png

http://zh-cn.b2clead.me/wp-content/uploads/2023/12/Telegram-Number-Data-3-1.png

正确回答简单和困难的答案

ChatGPT正确回答了简单和复杂的问题。其中最简单的是，他给出了关于法院司法年度开始的正确答案：十月的第一个星期一（问题3）；确定约翰·杰伊为最高法院第一任首席大法官（问题 1）；当您报道威廉·O·道格拉斯是在法庭上呆的时间最长的部长时，您是正确的（问题 2）。他还正确地指出，最初朝廷有六位大臣（问题 32）。

在最复杂的问题中，其中一些是困难的，他逻辑地解释了为什么前部长安东尼·肯尼迪被认为是法庭上由五位保守派和四位自由派部长组成的法庭中的佼佼者（问题36）。他用四段详细解释了导致参议院确认部长程序日益政治化的历史原因。

在要求解释“重新列出”一词（最高法院熟悉但外界鲜为人知）的问题 43 中，ChatGPT正确地回答说，它指的是法官在多个会议上讨论的判决请求，如果是否或不授予调卷。

頁: [1]

歡樂新世界v3.0's Archiver

ChatGPT在美国最高法院测试中表现不佳