A crescente integração de sistemas de inteligência artificial na área da saúde tem suscitado interesse, nomeadamente no domínio da triagem clínica, onde a tomada de decisão rápida e adequada é determinante para a segurança do doente.
Um estudo recentemente publicado na Nature Medicine avaliou o desempenho do ChatGPT Health na formulação de recomendações de triagem, com base em cenários clínicos estruturados. Os resultados agora divulgados contribuem para a reflexão sobre o potencial e as limitações destas ferramentas em contextos clínicos exigentes.
O presente artigo sintetiza os principais aspetos do estudo “ChatGPT Health performance in a structured test of triage recommendations”, remetendo para a leitura integral do trabalho para uma análise detalhada.
O estudo teve como objetivo analisar a capacidade do sistema ChatGPT Health em classificar adequadamente o nível de prioridade clínica em diferentes situações simuladas.
Para o efeito, foram utilizados:
As recomendações produzidas foram comparadas com classificações previamente estabelecidas por profissionais de saúde, permitindo avaliar o grau de concordância e identificar padrões de desempenho.
Importa salientar que a avaliação foi realizada em ambiente controlado, com base em cenários simulados, não correspondendo a uma aplicação em contexto clínico real.
Os resultados obtidos evidenciam um desempenho variável do ChatGPT Health na triagem clínica, com diferenças relevantes consoante o grau de urgência das situações analisadas.
No que respeita a casos classificados como emergência, verificou-se uma capacidade limitada do sistema para reconhecer adequadamente a gravidade clínica. Foram identificadas situações de subtriagem, nas quais casos potencialmente graves foram classificados como menos urgentes.
Este tipo de erro assume particular relevância, uma vez que pode traduzir-se em atrasos na prestação de cuidados adequados.
Nos cenários de urgência intermédia, o sistema apresentou um nível de concordância mais elevado com as classificações de referência. Este resultado sugere maior consistência em contextos clínicos menos extremos.
O estudo identificou igualmente episódios de sobretriagem, em que situações de menor gravidade foram classificadas como mais urgentes do que o necessário.
Embora este tipo de classificação tenha menor impacto direto na segurança do doente, pode contribuir para uma utilização menos eficiente dos recursos disponíveis.
De forma global, foi observado um padrão de desempenho caracterizado por maior precisão em níveis intermédios de gravidade e maior variabilidade nos extremos. Este comportamento levanta questões relevantes quanto à consistência do sistema em situações de maior exigência clínica.
A triagem clínica constitui um processo estruturado que visa a priorização adequada dos doentes, com base na avaliação do risco e da gravidade das suas condições.
Neste contexto, a identificação correta de situações de emergência é crítica, sendo a subtriagem um dos erros com maior potencial de impacto negativo. Por outro lado, a sobretriagem pode afetar a eficiência operacional dos serviços de saúde.
Os resultados agora apresentados reforçam a importância da utilização de sistemas de triagem validados e da intervenção de profissionais qualificados, particularmente em contextos de maior complexidade clínica.
A interpretação dos resultados deve ter em consideração algumas limitações do estudo, designadamente:
Estas limitações sugerem a necessidade de estudos adicionais, nomeadamente em contextos reais de utilização.
A aplicação da inteligência artificial na triagem clínica apresenta potencial enquanto ferramenta de apoio à decisão. Contudo, os resultados deste estudo indicam que subsistem desafios significativos, particularmente na identificação de situações de maior gravidade.
A integração destas tecnologias deverá, assim, ser acompanhada por:
Neste enquadramento, a inteligência artificial deve ser entendida como um complemento à prática clínica, não substituindo o julgamento profissional.
O estudo publicado na Nature Medicine fornece evidência relevante sobre o desempenho do ChatGPT Health na triagem clínica, evidenciando limitações na identificação de situações de emergência e variabilidade nos resultados obtidos.
Estes dados reforçam a necessidade de uma abordagem prudente na adoção de soluções baseadas em inteligência artificial, particularmente em contextos onde a segurança do doente constitui uma prioridade central.
Para consulta do estudo completo:
https://www.nature.com/articles/s41591-026-04297-7