中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

安全动态发布时间：2024-05-08 13:22:13 35 浏览

原文标题：GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models

原文作者：Kunsheng Tang, Wenbo Zhou, Jie Zhang, Aishan Liu, Gelei Deng, Shuai Li, Peigui Qi, Weiming Zhang, Tianwei Zhang, and Nenghai Yu

发表会议：ACM CCS 2024

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

主题类型：大模型安全

笔记作者：唐坤生@USTC

主编：黄诚@安全学术圈

针对LLMs的性别偏见评估与去偏框架

采用我们所提出GenderCARE框架的去偏结果

5. 论文信息

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

相关论文已被ACM CCS 2024接受，作者为中国科学技术大学的唐坤生、周文柏、李帅、齐培贵、张卫明、俞能海，南洋理工大学的张杰、邓格雷、张天威，北京航空航天大学的刘艾杉。

安全学术圈招募队友-ing
有兴趣加入学术圈的请联系 secdr#qq.com

免责声明：文章内容不代表本站立场，本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺，仅供读者参考，文章版权归原作者所有。如本文内容影响到您的合法权益（内容、图片等），请及时联系本站，我们会及时删除处理。查看原文