PubMedBERT:生物医学自然语言处理领域的特定预训练模型

147次阅读

今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta，这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中，大语言模型并不一定就是最优的解决方案，“小”模型也有一定的用武之地，所以今天我们来介绍PubMedBERT，它使用特定领域语料库从头开始预训练BERT，这是微软研究院2022年发布在ACM的论文。

论文的主要要点如下：

对于具有大量未标记文本的特定领域，如生物医学，从头开始预训练语言模型比持续预训练通用领域语言模型效果显著。提出了生物医学语言理解与推理基准(BLURB)用于特定领域的预训练。

PubMedBERT

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

研究表明，从头开始的特定领域预训练大大优于通用语言模型的持续预训练，从而表明支持混合领域预训练的主流假设并不总是适用。

使用BERT。对于掩码语言模型(MLM)，全词屏蔽(WWM)强制要求整个词必须被屏蔽。

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

据作者介绍，BLUE[45]是在生物医学领域创建NLP基准的第一次尝试。但BLUE的覆盖范围有限。针对基于pubmed的生物医学应用，作者提出了生物医学语言理解与推理基准(BLURB)。

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

PubMedBERT使用更大的特定领域语料库(21GB)。

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

结果展示

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

在大多数生物医学NLP任务中，PubMedBERT始终优于所有其他BERT模型，并且通常具有显著的优势。

责任编辑：华轩
来源：
DeepHub IMBA

大语言模型 PubMedBERT

文章来源于互联网:PubMedBERT:生物医学自然语言处理领域的特定预训练模型 | https://www.51cto.com/article/774702.html

正文完

PubMedBERT 数据模型生物医学自然语言训练

发表至：最新资讯

2023-11-27

0

前端又出新框架了，你还学得动吗？

OpenAI开放大模型微调功能！上传自己数据就可定制GPT-3.5Turbo

微软祭出代码大模型WaveCoder！四项代码任务两万个实例数据集，让LLM泛化能力飙升

人工智能与创造力：模糊人与机器之间的界限

LLMLingua:集成LlamaIndex，对提示进行压缩，提供大语言模型的高效推理

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

PubMedBERT

1、特定领域Pretraining

2、模型

3、BLURB数据集

结果展示

汇总40个国内外ChatGPT(4o/4.0/3.5)镜像网站（2024年10月最新）

机器学习——解释性AI（Explainable AI）

人工智能时代，程序员如何保持核心竞争力？

【深度学习模型】扩散模型(Diffusion Model)基本原理及代码讲解

如何用ChatGPT 8小时写出一篇完整论文（附完整提示词）