ABC | Volume 114, Nº4, Abril 2020

Artigo de Revisão Marques et al. Inteligência Artificial em Cardiologia Arq Bras Cardiol. 2020; 114(4):718-725 Tabela 1 – Breve descrição e classificação das principais ferramentas de ML Ferramenta Descrição Aprendizado SVM É útil para problemas de classificação de dois grupos. A ideia é encontrar uma função chamada hiperplano a partir da resolução de um sistema linear construído a partir das várias lições do subconjunto de treinamento. 40 Esse hiperplano é utilizado para agrupar as lições do subconjunto de teste em dois grupos disjuntos. Supervisionado NB Foi inspirado nos estudos do reverendo Bayes sobre a probabilidade condicional. 41 Essas probabilidades são usadas para identificar a categoria (de um total de n possível) a que uma lição específica pertence. 42 Supervisionado KNN Diz-se que uma norma de vetor é uma função matemática, que satisfaz propriedades específicas, e associa um vetor a um valor maior ou igual a zero. 43 A norma da diferença entre dois vetores é a distância entre eles. O KNN utiliza uma norma para calcular a distância entre todos os vetores (lições) que compõem o banco de dados. Então, para cada vetor do banco de dados, os vetores k mais próximos a ele são determinados. A inclusão em um determinado grupo é obtida a partir de um sistema de votação majoritária entre os vizinhos. 44,45 Supervisionado AG Algoritmos inspirados na evolução biológica das espécies, nos quais cada possível candidato para solucionar o problema é modelado como um cromossomo constituído por um conjunto de genes, que durante a execução do algoritmo é submetido a operações de cruzamento e mutação para obter melhor soluções que as atuais. 46 Dessa forma, eles permitem que um banco de dados seja separado, por exemplo, em dois grupos distintos – que possuem ou não uma característica específica. Supervisionado RF Esse método é baseado na construção de várias árvores de decisão. O primeiro passo é obter várias amostras aleatórias (com reposição) de lições para criar outros bancos de dados, um processo chamado “bootstrapping”. Cada um desses novos bancos de dados dará origem a uma árvore de decisão, obtida de forma iterativa, a partir de um subconjunto de variáveis (características). Após a construção de todas as árvores, uma nova lição no banco de dados deve ser alocada ao grupo que tem o maior número de árvores de decisão, mostrando que ele pertence a esse grupo (maioria dos votos). 47,48 Supervisionado K-means Permite particionar um banco de dados em k grupos com características semelhantes. Para isso, é necessário atualizar, de maneira iterativa, um conjunto de vetores, chamados centroides de referência de cada grupo e calcular a distância de cada lição para cada um. Uma lição é sempre alocada ao centroide para o qual ela tem a menor distância. O gráfico de cotovelo é geralmente utilizado para determinar o número ideal de grupos a serem separados do banco de dados. 49 Não supervisionado ANN Inspirado nos sistemas nervosos biológicos, é utilizada uma estrutura chamada gráfico – um conjunto de nós e bordas – em que os nós são estratificados e conectados por bordas com valores, que representam um peso atribuído a uma determinada conexão. A ideia é que, a partir de um conjunto de entradas, esses pesos sejam utilizados corretamente para produzir uma saída. Várias arquiteturas foram propostas para redes neurais, desde as mais simples, como a perceptron, até as mais sofisticadas, como a função de base radial, redes convolucionais e aprendizado profundo. No aprendizado profundo, além das camadas de entrada e saída, existem camadas ocultas que aumentam significativamente o número de pesos a serem atualizados e geralmente exigem grandes esforços computacionais. A rede convolucional é um tipo de aprendizado profundo inspirada no córtex visual de animais que tem um papel importante na análise de imagens. Autoencoders e redes neurais de Kohonen são exemplos de aprendizado não supervisionado. 1,7,50-52 Não supervisionado ou Supervisionado GB É um método baseado em árvore que utiliza gradientes, vetores relacionados à direção do aumento máximo em uma função matemática, para produzir árvores de decisão sequenciais a serem combinadas para aprimorar a previsão. Variantes desta abordagem incluem o Stochastic Gradient Descent que incorpora uma sub-amostra aleatória para GB. 53,54 Supervisionado à terapia de ressincronização cardíaca. Foram analisados 1.106 pacientes e identificados quatro grupos disjuntos, dois deles com a melhor resposta à terapia. 32 g) Artificial Neural Networks (ANN): Kwon et al., 33 em um estudo multicêntrico com 52.131 pacientes, construíram um sistema de alerta precoce baseado em aprendizado profundo capaz de prever a ocorrência de parada cardíaca emumhospital. O modelo demonstrou alto desempenho quando comparado aos sistemas tradicionais do tipo “ track‑and-trigger ” (rastreamento e disparo). A área sob a curva foi de 0,82. 33 Rubin et al., 34 tiveram resultados preliminares promissores com o uso de redes neurais com arquitetura convolucional para avaliar sinais eletrocardiográficos e classificá-los em fibrilação atrial, ritmo sinusal (normal) ou ruído – o escore F1 alcançado foi de 0,82. 34 Zhang et al., 35 também utilizaram redes neurais convolucionais para analisar um banco de dados com 14.035 exames ecocardiográficos para detectar a presença de doenças como cardiomiopatia hipertrófica, amiloidose cardíaca e hipertensão arterial pulmonar com alto desempenho: as estatísticas C foram respectivamente de 0,93, 0,87 e 0,85. 35 Nakajima et al., 36 utilizaram uma ANN para avaliar a presença de doença coronariana após a realização de cintilografia do miocárdio. Os resultados foram obtidos com alta precisão e desempenho superior aos escores tradicionais utilizados. Por exemplo, a AUC para pacientes com infarto do miocárdio antigo com base em defeitos na fase de repouso foi de 0,97. 36 h) Gradient Boosting (GB): Mortazavi et al., 37 utilizaram o GB para predizer o risco de sangramento após intervenção coronária percutânea e demonstraram que essas ferramentas podem ajudar a identificar pacientes que se beneficiariam de estratégias objetivando a redução do risco de sangramento. Foram analisados 3.316.465 procedimentos e obtida uma estatística C de 0,82 37 . Hernesniemi et al., 38 também propuseram um GB para prever a mortalidade na síndrome coronariana aguda, analisando 9.066 pacientes consecutivos. A AUC foi de 0,89 e omodelo apresentoumelhor desempenho do que o do escore tradicional GRACE. 38 É importante observar que, ao utilizar qualquer modelo de ML, deve-se ter em mente um grande problema que pode surgir, chamado sobreajuste ( overfitting ). Ele ocorre quando ummodelo descreve muito bem os exemplos (subconjunto de treinamento) e apresenta baixo desempenho quando aplicado a outras instâncias do mesmo fenômeno. 39 Além disso, é importante dizer que não há resultado teórico que garanta que qualquer um dos algoritmos de IA seja melhor que os outros em qualquer aplicação. 721

RkJQdWJsaXNoZXIy MjM4Mjg=