金融圈大事！彭博研究人员推出bloomberggpt -亚博电竞网

金融圈大事！彭博研究人员推出bloomberggpt

5051

2023-03-31 15:36:03

吴小辣

导读： ai之火烧到金融圈，bloomberggpt率先打响金融行业开发和应用新技术的第一枪。

美东时间3月30日，全球最大的财经资讯公司彭博社发布最新公告称，该公司开发了专为金融领域量身打造的拥有500亿参数的大型语言模型（llm）——bloomberggpt。以下为公告具体内容，由chatgpt-4翻译完成：

在金融自然语言处理任务方面，bloomberggpt在同等规模的开放模型中表现出色，且不牺牲通用llm基准的性能。

彭博发布了一篇研究论文，详细介绍了bloomberggpt的开发过程，这是一种新型大规模生成人工智能（ai）模型。这种llm专门针对广泛的金融数据进行训练，以支持金融行业内各种自然语言处理（nlp）任务。

基于llm的人工智能（ai）的最近进展已经展示了许多领域令人兴奋的新应用。然而，金融领域的复杂性和独特术语需要一个特定领域的模型。bloomberggpt代表着为金融行业开发和应用这种新技术的第一步。该模型将协助彭博改进现有的金融nlp任务，如情感分析、命名实体识别、新闻分类和问答等。此外，bloomberggpt将为整合彭博终端上的大量数据提供新机会，以更好地帮助公司的客户，同时将ai的全部潜力带入金融领域。

十多年来，彭博在金融领域的人工智能、机器学习和自然语言处理方面一直处于领先地位。如今，彭博支持大量且多样的nlp任务，这些任务将受益于一个新的金融感知语言模型。彭博研究人员开创了一种混合方法，将金融数据与通用数据集相结合，以训练一个在金融基准上取得最佳成绩的模型，同时在通用llm基准上保持竞争力。

为了实现这一里程碑，彭博的机器学习产品和研究小组与公司的人工智能工程团队合作，利用公司现有的数据创建、收集和策划资源，构建了迄今为止最大的特定领域数据集之一。作为一家金融数据公司，彭博的数据分析师已经收集和维护了40年的金融语言文件。团队从这个庞大的金融数据档案中提取信息，创建了一个包含英语金融文件的3630亿标记的综合数据集。

该数据集与一个3450亿标记的公共数据集结合，创建了一个包含超过7000亿标记的大型训练语料库。使用这个训练语料库的一部分，团队训练了一个具有500亿参数的仅解码器因果语言模型。生成的模型在现有的金融特定nlp基准、一套彭博内部基准和来自流行基准（例如big-bench hard，知识评估，阅读理解和语言任务）的通用nlp任务的广泛类别上进行了验证。值得注意的是，bloomberggpt模型在金融任务方面大幅超越了类似规模的现有开放模型，同时在通用nlp基准上的表现相当或更好。

bloomberggpt在金融特定和通用任务两个广泛类别的nlp任务上的表现

彭博首席技术官shawn edwards表示：

“我们认为具有金融领域特点的大型生成性llm具有巨大价值，原因有很多——少量样本学习、文本生成、对话系统等。我们很高兴能开发出第一个专注于金融领域的llm。bloomberggpt将使我们能够解决许多新类型的应用，同时它的性能优于为每个应用定制的模型，且上市时间更快。”

彭博机器学习产品和研究团队负责人gideon mann解释说：

“机器学习和nlp模型的质量取决于你输入的数据。得益于彭博在四十年间策划的金融文件，我们得以精心打造一个大型、干净、特定领域的数据集来训练一个最适合金融用途的llm。我们很高兴能够利用bloomberggpt改进现有的nlp工作流程，同时也思考新的方法将这个模型投入使用，为我们的客户带来惊喜。”

该文由gpt-4翻译完成

转载说明：此文出自于金十数据，如需转载，请注明原文出处。若未注明原文来源随意摘编、转载等，金十数据将保留追究权利。

金融圈大事！彭博研究人员推出bloomberggpt -亚博电竞网

金融圈大事！彭博研究人员推出bloomberggpt

金十推荐