0420/2023 - Ferramenta para Análise do Deslocamento de Pacientes em Tratamento de Câncer de Mama no SUS a partir do Registro Hospitalar de Câncer
A Tool for Analysis of Patients\' Travels for Treating Breast Cancer in the Brazilian Public Health System Based on the National Hospital Cancer Registry
Autor:
• Luis Fernado Reis Tavares Pais - Pais, L. F. R. T. - <luisfernandopais@gmail.com>ORCID: https://orcid.org/0000-0002-4802-0196
Coautor(es):
• José Luiz Barbosa Bevilacqua - Bevilacqua, J. L. B. - <bevilacqua@mastologia.com>ORCID: https://orcid.org/0000-0002-3052-4062
• José Maria Parente de Oliveira - de Oliveira, J. M. P. - <parente@ita.br>
ORCID: https://orcid.org/0000-0002-7803-1718
• Ricardo da Silva Santos - Santos, R. da S. - <rsantos@ita.br; rsantos@cmpx.com.br>
ORCID: https://orcid.org/0000-0001-8933-790X
Resumo:
No Brasil, foi estimado 704 mil casos no triênio 2023-2025, sendo o câncer de mama o tipo mais incidente com 10,37% do total. A organização de redes de atenção baseia-se no modelo regionalizado. Tal organização, contudo, faz com que os pacientes, algumas vezes, tenham de percorrer longas distâncias para receberem o diagnóstico e o tratamento. O deslocamento de pacientes vem sendo alvo de estudos em todo o mundo. No contexto internacional, o principal foco é analisar a associação entre o deslocamento e o desfecho clínico. No cenário nacional, o foco ainda se restringe à caracterização dos deslocamentos, e para isso, usa a base de dados do sistema de informações ambulatoriais (SIA-SUS). Considerando a necessidade de avaliar o uso de uma base que permita análises mais detalhadas sobre o deslocamento de pacientes, o objetivo deste trabalho foi apresentar o desenvolvimento de uma ferramenta computacional para análise de deslocamentos de pacientes em tratamento de câncer de mama no SUS, a partir dos dados do Registro Hospitalar de Câncer (RHC). A ferramenta foi desenvolvida e implementada, e, apesar de limitações potenciais, ela se mostrou eficiente na produção de informações, demonstrando assim que é possível usar o RHC para analisar o deslocamento de pacientes.Palavras-chave:
análise de dados, mineração de dados, neoplasias da mama, regionalização da saúde, acesso aos serviços de saúdeAbstract:
In Brazil, it was estimated that there will be around 704 thousand new cases of cancer in the period 2023-2025, with breast cancer being the most frequent type with 10.37% of the total. The organization of care networks is based on the regionalized model. This organization, however, means that patients sometimes must travel long distances to receive the diagnosis and treatment. The patient's travels have been the subject of studies around the world. In the international context, the focus is on the association between travel and clinical outcome. In the national scenario, the focus is still restricted to the characterization of travel distance, and for this purpose, it uses the database of the outpatient information system (SIA-SUS). Considering the need to evaluate the use of a database that allows more detailed analyses of patients' travels, the goal of this work was to present the development of a computational tool for the analysis of patients' travels for treating breast cancer, based on the National Hospital Cancer Registry (RHC). The tool was developed and implemented, and, despite potential limitations, it proved to be efficient in producing information, thus demonstrating that it is possible to use the RHC to analyze the patients' travels.Keywords:
data analysis, data mining, breast neoplasms, regional health planning, health services accessibilityConteúdo:
O câncer vem sendo considerado a principal barreira ao aumento da expectativa de vida em todos os países, com taxas de incidência e de mortalidade em crescimento acelerado [1]. No Brasil, estima-se mais de 704 mil novos casos no triênio 2023-2025, sendo o câncer de mama o tipo mais incidente com 10,37% do total [2].
Em 2013, foi instituída no Brasil a Política Nacional para a Prevenção e Controle do Câncer, que enfatiza a organização de redes de atenção regionalizadas e descentralizadas [3]. Tal política pressupõe que o acesso aos serviços seja feito em unidades próximas ao local de residência dos pacientes; no entanto, há alguns fatores no SUS (Sistema Único de Saúde) que dificultam a formação de redes regionais homogêneas: a heterogeneidade do território brasileiro, a formalização de responsabilidades institucionais em cada um dos níveis de atenção, e a delicada questão político-administrativa da manutenção de autonomia dos governos locais com as regulações federais e estaduais, entre outros [4].
As diferenças, entretanto, ocorrem até mesmo em um único estado. Alves e Magalhães [5] citam a região de saúde do norte de Minas Gerais como um exemplo onde a distribuição geográfica não está otimizada, tendo somente um centro municipal com serviços oncológicos para atender toda a região, incluindo cidades a mais de 300 quilômetros de distância.
A consolidação de centros especializados em oncologia, buscando a otimização dos recursos de saúde, é comum em várias partes do mundo. Contudo, isso faz com que os pacientes muitas vezes tenham de percorrer longas distâncias para receberem o diagnóstico e o tratamento adequados.
O deslocamento de pacientes em tratamento de câncer vem sendo alvo de estudos em todo o mundo.
No contexto internacional, o principal foco é a análise da associação entre o deslocamento dos pacientes e o seu impacto no estadiamento e no desfecho clínico [6-11]. Tais estudos, com exceção de Fabian et al. [8], mostram uma associação negativa entre o tempo de viagem e o estágio do câncer no diagnóstico, assim como o seu desfecho clínico. Esse estudo comparou a apresentação clínica de pacientes com retinoblastoma em países da Europa e da África. Os resultados mostraram que os pacientes de países africanos viajam distâncias menores, no entanto, apresentam o estágio do câncer no diagnóstico mais avançado.
No cenário brasileiro, o foco se restringe à caracterização dos deslocamentos, sem, entretanto, analisar os impactos associados a esses deslocamentos, e para isso, usa a base de dados do sistema de informações ambulatoriais (SIA-SUS) [4,5,12,13,14].
Deve-se esperar que a evolução natural dos estudos nacionais seja a análise da associação entre o deslocamento do paciente e o seu desfecho clínico. No entanto, esse próximo estágio requer o uso de uma base de dados com informações mais detalhadas sobre o tratamento do paciente, tal como o Registro Hospitalar de Câncer (RHC) [15,16].
Considerando a necessidade de avaliar a viabilidade de usar a base de dados do RHC, o objetivo deste trabalho foi apresentar o desenvolvimento de uma ferramenta computacional para análise de deslocamentos de pacientes em tratamento de câncer de mama no SUS, a partir dos dados do RHC.
Métodos
O processo de desenvolvimento e validação da ferramenta consistiu em cinco grandes etapas:
1. Carga inicial de dados do RHC
2. Seleção do subconjunto de dados
3. Pré-processamento dos dados
4. Elaboração do painel de análises descritivas
5. Validação da ferramenta
A carga inicial de dados consistiu em coletar os dados públicos do RHC e armazená-los em um banco de dados local.
A próxima etapa consistiu em filtrar, do banco local, um subconjunto de dados restrito ao escopo do estudo desejado; no nosso caso, câncer de mama.
O pré-processamento corresponde à preparação dos dados, visando deixá-los em um formato adequado à elaboração das análises.
A quarta etapa corresponde à elaboração de um painel contendo as análises descritivas, por meio de gráficos e tabelas dinâmicas.
Finalmente, a quinta etapa consistiu na validação da ferramenta.
Carga Inicial de Dados
Os Registros Hospitalares de Câncer (RHC) podem ser caracterizados como centros de informação situados em Unidades Hospitalares (UH) de assistência oncológica, cujas atividades incluem: a coleta de dados dos pacientes com diagnóstico confirmado de câncer atendidos nessas unidades; o armazenamento e processamento desses dados; a análise e divulgação dessas informações [17].
O INCA é o órgão responsável pela consolidação e publicação em âmbito nacional das informações geradas pelos RHC de todo o Brasil. Para isso, desenvolveu dois sistemas: SisRHC e IntegradorRHC. O IntegradorRHC, é um sistema web que efetua a consolidação e divulgação dos dados hospitalares incluídos no SisRHC [15, 18].
As UH enviam os dados através da internet e cabe às coordenações estaduais fazerem uma primeira consolidação estadual. Posteriormente, é feita também uma consolidação nacional, para que só então os dados possam ser divulgados no site do IntegradorRHC. A principal função dessa consolidação é identificar redundâncias (casos em que o paciente foi registrado em mais de um centro de tratamento) e eliminá-las, evitando assim que o número de ocorrências seja indevidamente superestimado [18].
Foram carregados os arquivos do RHC disponibilizados no site do INCA, contemplando o período de 2000 a 2017. A data da primeira consulta foi o atributo usado para a delimitação do período.
A fim de avaliar a coerência dos dados carregados em cada ano, dois métodos foram adotados: o volume de registros, a fim de identificar se haveria algum período muito discrepante dos demais; e uma consulta comparativa no site do DATASUS, para comprovar se a quantidade de casos carregados estaria coerente com os valores apresentados pelo DATASUS. Caso fosse encontrada alguma discrepância, o arquivo deveria ser desconsiderado da carga, e recarregado após identificação e correção do problema.
Seleção do Subconjunto de Dados (Dataset)
O processo de carga incluiu no banco de dados registros referentes a todos os tipos de câncer. No entanto, cada estudo elaborado pela ferramenta refere-se a apenas um tipo de câncer, no nosso caso, câncer de mama.
A seleção deve ser feita a partir do atributo “CID Primário”. Em nosso estudo foram considerados todos os registros cujos três primeiros dígitos do CID eram “C50”.
Além da seleção pelo atributo “CID Primário”, outros critérios de seleção também foram adotados: atributo “Sexo” com o valor igual a “2” (Feminino); e atributo “UF Residencial” diferente de “99” (este código indica uma Unidade da Federação desconhecida ou fora do Brasil).
A existência de atributos sem preenchimento na base de dados do RHC não constituiu um critério de perda de registos; uma vez que o propósito primordial da ferramenta é mostrar o deslocamento dos pacientes, os únicos atributos que, obrigatoriamente, devem estar preenchidos corretamente são “Município de Residência” do paciente e “Município da Unidade” de tratamento.
Pré-processamento
A atividade mais importante da etapa de pré-processamento é a inclusão do atributo “Distância Percorrida”, que deve armazenar a distância percorrida da residência do paciente à unidade hospitalar de tratamento.
O deslocamento do paciente foi calculado a partir da distância entre os municípios de residência do paciente e da unidade de tratamento, uma vez que o endereço exato do paciente não está disponível no arquivo origem. Algumas premissas foram assumidas para esse cálculo.
A primeira delas foi que a distância seria considerada zero (0 km) quando os municípios de residência e da unidade hospitalar fossem os mesmos; independentemente do porte da cidade.
Uma vez que, não há como identificar qual foi o transporte utilizado pelo paciente, adotou-se como segunda premissa considerar o meio de transporte rodoviário como a forma de deslocamento.
A última premissa foi que o cálculo da distância adotaria a malha rodoviária existente no momento do cálculo, outubro de 2019, e refletiu, portanto, o caminho disponível nessa ocasião. Se, por acaso, no ano 2000 não existia uma estrada pavimentada entre dois municípios, que existia em 2019; o deslocamento talvez pudesse ter sido maior, no entanto, isto não foi considerado no cálculo.
Caso as condições anteriores não pudessem ser atendidas, a distância seria calculada usando a diferença geodésica entre dois pontos, através de sua latitude e longitude. O cálculo geodésico não considera o relevo, as estradas e as barreiras naturais entre municípios e, por isso, não é de todo correto, mas foi considerado neste estudo como uma aproximação válida. Tal cálculo poderia ser útil, por exemplo, em municípios localizados em ilhas (como Fernando de Noronha) ou cujo acesso é somente via barcos.
Para calcular a distância de deslocamento de cada ocorrência da base, foi feita inicialmente uma consolidação dos dados, a fim de identificar somente os pares origem-destino unívocos. Por meio de uma planilha auxiliar, os dados da base principal foram agrupados e selecionadas apenas as quatro colunas necessárias para calcular a distância de deslocamento: a UF e o município de residência do paciente, e a UF e o município da unidade hospitalar.
O cálculo da distância em metros foi feito por meio de uma interface (Application Programming Interface, ou API) disponibilizada pelo Google em sua plataforma relacionada a mapas.
Após o cálculo para todos os pares origem-destino da tabela auxiliar, cada registro do dataset foi atualizado com a distância correspondente ao deslocamento do paciente.
Também foi necessário incluir um atributo sequencial numérico que permite a identificação unívoca de cada registro, algo essencial para execução de algoritmos de mineração de dados.
Outra alteração necessária no dataset foi o desmembramento do atributo “Tipo Tratamento”. No arquivo original do RHC, o valor desse atributo é a concatenação dos códigos dos diversos tipos de tratamento. Assim, para se obter uma listagem completa de todos os tipos, deve-se usar uma função do banco de dados que separa estes códigos, cada um em uma linha, mantendo os demais atributos. Por exemplo, uma ocorrência que originalmente tinha esse formato:
UF Município Tipo Tratamento
SP Suzano Cir Qui Rad
Após a execução da função é desmembrada em três linhas:
UF Município Tipo Tratamento
SP Suzano Cir
SP Suzano Qui
SP Suzano Rad
Outros atributos incluídos no subconjunto de dados foram as esferas administrativas existentes entre a UF e o município. Isso possibilita a elaboração de análises a partir de diferentes níveis hierárquicos, desde o município, passando pelas regiões e macrorregiões de saúde, pelo estado, até a região geográfica.
Essa inclusão foi feita tanto para o município residencial quanto para o município da unidade hospitalar. Com esses dados, é possível identificar se um determinado tratamento ocorreu dentro ou fora da esfera em análise.
Elaboração do Painel de Análises Descritivas
As análises descritivas foram separadas em quatro grupos distintos: Tipo de Tratamento, Perfil do Paciente, Perfil do Tumor e Deslocamento; os quais foram em seguida divididos em subgrupos. Esses agrupamentos foram feitos para segregar as análises com características semelhantes, permitindo um estudo exploratório das características por região e possibilitando assim melhor compreensão do deslocamento nas regiões envolvidas.
Para cada grupo e subgrupo foram criadas páginas web com botões e atalhos para auxiliar na navegação. As análises dos três primeiros grupos foram desenvolvidas com recursos de tabelas dinâmicas e gráficos. Em cada subgrupo, é possível filtrar os dados de um determinado estado e compará-los com os resultados do Brasil. Também é possível filtrar o período de análise, que pode incluir um ou mais anos.
As variáveis utilizadas nesses três primeiros grupos incluem: “Tipo de Tratamento”, “Localização Primária,” “Lateralidade”, “Estadiamento”, “Faixa Etária”, “Grau Instrução”, “Raça”, “Histórico Familiar”, “Tabagismo”, “Alcoolismo”, “Mais de um Tumor”, “Origem Encaminhamento”.
Algumas dessas variáveis possuem um alto percentual de não preenchimento ou preenchidas com o valor “Sem Informação”, no entanto, elas foram mantidas nas análises. Um dos benefícios em mantê-las é a possibilidade de elaborar relatórios que mostrem o percentual de preenchimento dessas variáveis, o que pode subsidiar futuras ações de melhoria da qualidade dessa base de dados.
As análises do quarto grupo, destinado à descrição dos deslocamentos, foram elaboradas no software Microsoft Power BI e inclui painéis interativos com recursos de navegação web e opções de segmentação e detalhamento (drill-down) dos dados.
Além das análises descritivas, a ferramenta oferece suporte para o desenvolvimento de modelos de mineração de dados. Tais modelos são implementados internamente na ferramenta, não estando disponíveis diretamente ao usuário final, e podem ser usados em duas fases distintas: no pré-processamento dos dados e no apoio à interpretação dos resultados das análises descritivas.
Na fase de pré-processamento foi usada a técnica de agrupamento (clustering) a fim de discretizar os valores contínuos e substituí-los por faixas de valores; o que facilita a análise estatística.
Para a elaboração dos modelos de mineração de dados foi usado o software MS-SQL Analysis Services.
A técnica usada foi o Agrupamento (Clustering); aplicada na discretização dos atributos numéricos do dataset que possuem um intervalo de valores muito amplo e variado. A discretização por agrupamento foi aplicada aos três atributos numéricos do dataset: “Distância de deslocamento”, “Dias até o tratamento” e “Idade”.
Validação da Ferramenta
Zhuang et al. [19] propõe uma estrutura abrangente para avaliar painéis de dados em saúde, no entanto, considerando o objetivo da ferramenta proposta, foram validados apenas dois aspectos: consistência dos dados e usabilidade.
A validação da consistência dos valores produzidos pela ferramenta foi feita por meio da comparação direta com os valores compilados a partir da ferramenta do DATASUS denominada TABNET. Em muitos casos, devido à limitação do TABNET, foi necessária a compilação de dois ou mais relatórios em uma planilha Excel, e, posteriormente, a comparação desses valores com os valores apresentados pela ferramenta.
A avaliação da usabilidade foi realizada pelo uso direto da ferramenta por dois usuários com experiência em Saúde Pública. Os usuários atribuíram notas, em uma escala de zero a dez, para os seguintes critérios: desempenho da ferramenta, layout da tela, formato de apresentação da informação, funcionalidades de filtros e detalhamentos (drill-down).
Resultados
A base de dados foi carregada inicialmente com os registros do RHC do período de 2000 a 2017. No entanto, foi verificado que o ano de 2017 continha uma quantidade de registros muito inferior aos anos anteriores, apenas 40% dos registros de 2016. Dessa forma, o arquivo referente àquele ano foi desconsiderado. Foram então mantidos os dados de 2000 a 2016, totalizando 3.176.138 casos.
Aplicando os critérios de seleção definidos para a criação do dataset, foram selecionados apenas os casos de câncer de mama, com 492.148 casos.
Considerando a falta de preenchimento do atributo “Município de Residência”, foram descartados apenas 125 registros (0,00002%), totalizando 492.023 casos.
Usando a interface disponibilizada pelo Google Maps (API) foi possível calcular a distância de deslocamento para 99,1% dos registros do dataset. Os restantes 0,9% não puderam ser obtidos pela API por serem locais em que não havia transporte rodoviário disponível. A maioria dos casos era de cidades da região Norte, como Afuá no Pará e Parintins no Amazonas – cidades acessíveis somente por via fluvial ou aérea – ou, ainda, a ilha de Fernando de Noronha em Pernambuco. Para esses casos, foi obtida a distância geodésica.
Uma vez concluídos a carga e o pré-processamentos do dataset, o painel de análises descritivas foi criado e a ferramenta foi implementada, encontrando-se disponível no site www.minersus.com.br.
Foram incluídos na tela inicial de navegação quatro botões que direcionam o usuário a cada um dos grupos de análise proporcionados pela ferramenta:
1. Perfil do Tratamento
2. Perfil do Paciente
3. Perfil do Tumor
4. Perfil do Deslocamento
O primeiro grupo de análise (Perfil do Tratamento) mostra, de forma gráfica, os percentuais anuais do Brasil e das unidades da federação, referentes a quantidade de casos em que houve um determinado tipo de tratamento em relação à quantidade total de ocorrências naquele mesmo período. Considerando o exemplo da Figura 1(A), observamos que o valor percentual referente ao tratamento de quimioterapia no país em 2010 foi de 50%. Tal percentual corresponde a ocorrência de 18.588 tratamentos para um total de 37.441 casos.
Conforme podemos observar na Figura 1, a ferramenta permite que se comparem os tipos de tratamento usados em um, ou mais, estados ou regiões.
Ainda nesse grupo de análise, várias outras opções de gráficos podem ser criadas, inclusive aqueles que mostram a evolução temporal dos tratamentos adotados pelos estados/regiões.
O segundo grupo de análise (Perfil do Paciente) permite a elaboração de gráficos que descrevem o perfil dos pacientes. Foram implementados gráficos para oito variáveis: “Faixa Etária”; “Grau de Instrução”; “Tabagismo”; “Alcoolismo”; “Histórico Familiar”; “Raça”; “Mais de um Tumor” e “Origem de Encaminhamento”.
Com exceção da “Faixa Etária”, que possui 100% de preenchimento, as demais variáveis relacionadas ao perfil do paciente possuem um elevado percentual de ausência de informação. “Grau de Instrução”, “Raça”, “Origem de Encaminhamento” e “Mais de um Tumor” apresentam um percentual superior a 30% sem preenchimento. “Histórico Familiar”, “Tabagismo” e “Alcoolismo” estão sem informação para mais de 50% dos casos.
O terceiro grupo de análise (Perfil do Tumor) permite a elaboração de gráficos que descrevem, quantitativamente, o perfil do tumor dos pacientes em estudo. As variáveis relacionadas ao perfil do tumor incluídas nesse grupo de análise são: “Estadiamento”, “Localização Primária” e “Lateralidade”.
Em relação ao percentual de preenchimento dessas variáveis, “Lateralidade” possui 11% de valores não preenchidos, “Estadiamento”, contém 27%, e “Localização Primária” 55% dos casos.
Padronizou-se o formato dos gráficos do segundo e terceiro grupos de análise, mostrando os dados gerais do Brasil no lado esquerdo da tela, os dados dos estados selecionados na parte central, e os filtros na parte direita (Figura 1).
Em todas as páginas de análises descritivas da ferramenta está disponível o botão “Dados da Amostra”, que leva a outra página com os dados exibidos em formato tabular (Figura 2).
Na tabela “Dados Completos” é possível identificar todos os valores possíveis para a variável em análise e suas respectivas ocorrências na amostra selecionada. Os valores selecionados na tela anterior para estados e ano podem ser alterados manualmente também nessa página. A tabela permite filtros por outros valores do atributo e seu conteúdo pode ser copiado para uma planilha.
O quarto grupo de análise (Deslocamento) contém um menu de navegação dividido em duas grandes visões: “Distâncias” e “Esferas de Tratamento”. A visão “Distâncias” exibe na tela principal uma tabela com duas colunas. A primeira coluna mostra a esfera selecionada (inicialmente agrupada por estados) e a segunda mostra o valor da distância média de deslocamento, em quilômetros, para cada esfera em questão (Figura 3). Por exemplo, a distância média de deslocamento dos pacientes em tratamento de câncer de mama em Minas Gerais é de 86,96 km, enquanto o deslocamento médio no estado do Maranhão é de 228,23 (considerando o período de 2000 a 2016).
Os valores são exibidos com uma coloração graduada do branco ao vermelho, indicando, respectivamente, as menores para as maiores distâncias (quanto mais forte o tom de vermelho, maior a distância média de deslocamento).
Ao clicar no ícone “mais” (+) ao lado de cada estado, pode-se abrir a hierarquia seguinte (macrorregião de saúde); da mesma forma, uma ação semelhante abre o próximo nível (região de saúde) e, em seguida, a hierarquia mais baixa (município). Ao abrir o nível municipal, são exibidas as unidades hospitalares às quais os pacientes daquela cidade foram se tratar – para facilitar a identificação, aparecem também a UF e a cidade de destino.
A Figura 3 mostra um exemplo desses recursos. O estado de Minas Gerais foi destacado, selecionando em seguida a macrorregião de saúde Centro-Sul, depois a região de saúde Barbacena, e por fim o município de Barbacena. Mesmo com alguns deslocamentos distantes para Bahia, São Paulo e Rio de Janeiro, a distância média é de 37,72 km. Subindo um nível, é possível ver que a média daquela região de saúde é de 53,97 km, e esse número aumenta ao se considerar a macrorregião de saúde Centro-Sul, para 149,01 km.
A visão “Esferas de Tratamento” foi construída com a ideia de que se possa navegar por todas as divisões administrativas, numa sequência hierárquica, do nível maior para o menor. Em cada um dos níveis são exibidos os percentuais de tratamentos feitos dentro (D) ou fora (F) daquela esfera administrativa.
O primeiro nível começa com os estados e os percentuais D/F de cada um, em formato tabular. Pode-se clicar no estado desejado e navegar (usando a opção “Detalhar”) para a esfera seguinte. Aparecem então todas as macrorregiões de saúde para o estado pré-selecionado, com seus percentuais de tratamento D/F. Usando o mesmo conceito, pode-se navegar para o detalhamento seguinte (região de saúde) e, mais uma vez, até a lista de municípios que compõem aquela divisão hierárquica. Ao chegar a esse último nível (esfera municipal), pode-se clicar no ícone “mais” (+) ao lado do município para exibir as unidades hospitalares em que os pacientes foram se tratar.
A Figura 4 mostra um exemplo desse tipo de análise. É possível verificar que o contador à esquerda apresenta o número arredondado de 10 mil registros, o qual é a soma dos totais de ocorrências exibidos na tabela (dentro: 4.067, fora: 6.284).
Pela imagem, pode-se ver que apenas cinco das doze regiões de saúde exibidas devem ter unidades hospitalares de tratamento oncológico (“Alfenas Machado”, “Passos Piumhi”, “Poços de Caldas”, “Pouso Alegre” e “Varginha”), pois nas outras o percentual de tratamento externo é de 100% dos casos. É visível também que as regiões com maior predominância de atendimento interno são as de Varginha e Poços de Caldas, com respectivamente 95% e 91% das ocorrências nessa situação.
Em relação aos modelos de mineração de dados usados para discretização de atributos, foram elaborados sete modelos diferentes para o atributo Distância, executados em sequência e variando os parâmetros do algoritmo, a fim de identificar os melhores intervalos possíveis. As faixas (arredondadas) obtidas pelo modelo vencedor estão indicadas na Figura 5(A).
Para a discretização do atributo “Dias até o Início do Tratamento”, foram elaborados cinco modelos, de modo a identificar os melhores intervalos possíveis. As faixas (arredondadas) obtidas pelo modelo vencedor estão indicadas na Figura 5(B).
Para o terceiro atributo (“Idade”), foram elaborados dez modelos diferentes, de forma análoga aos anteriores. Entretanto, os grupos identificados não se mostraram relevantes para as análises e, por isso, foram descartados. Para as faixas etárias, optou-se por utilizar a classificação indicada por especialista da saúde pública.
Em relação à validação da ferramenta, sob o aspecto de consistência dos dados, não foi detectada nenhuma divergência dos valores produzidos pela ferramenta e aqueles compilados a partir do TABNET. Sobre a avaliação da usabilidade, todos os critérios avaliados receberam notas acima de 8. O critério que recebeu menor nota (8.1) foi o desempenho, mas isso se justifica pelo fato de a ferramenta ter sido avaliada em um computador com processadores e memória aquém do recomendado.
Discussão
Primeiramente, deve-se ressaltar que as análises sobre câncer de mama apresentadas neste trabalho foram elaboradas a fim de validar as funcionalidades e características da ferramenta implementada. Portanto, tais análises não tem a pretensão de descrever um panorama completo do tratamento de câncer de mama do país, mas, tão somente, mostrar o potencial da ferramenta.
As análises criadas no primeiro grupo (Perfil do Tratamento), embora composta por gráficos simples, permitem visualizar informações importantes para a elaboração de políticas/ações de saúde pública. No exemplo da Figura 1, é possível identificar que a Bahia é o estado, dentre aqueles analisados, que apresenta o maior percentual de pacientes que não fizeram nenhum tratamento (17%), bem superior à média do país (7%). O estado que mais fez “outros” tratamentos foi Tocantins (6%), bem acima dos demais, que tem 1% ou 0%. O percentual de radioterapia é bem alto em Goiás (64%) e no Tocantins (62%). Os valores encontrados para cirurgia também têm algumas variações, com o menor índice no Rio Grande do Sul (36%) e o maior em Goiás (55%), enquanto a média nacional foi de 49% em 2010.
A Figura 1(B) mostra que dois Estados da Federação destoaram do perfil brasileiro, em relação ao estadiamento do tumor. Em todas as outras Unidades da Federação o estádio 2 é o que tem os maiores percentuais, enquanto em Mato Grosso e em Roraima o estádio 3 é que fica em primeiro (com, respectivamente, 40% e 42%). Vale ressaltar que a tela apresentada é um recorte de uma seleção que incluía todos os Estados.
Apesar do percentual relativamente alto de não preenchimento das variáveis relacionadas ao perfil do paciente, algumas informações interessantes foram obtidas a partir das análises criadas neste grupo. Por exemplo, um gráfico criado para analisar a Classificação Etária evidenciou que em Tocantins, no ano de 2010, o percentual de mulheres em tratamento na faixa de 40 a 49 anos (40%) estava bem acima da média brasileira (25%), ocupando a maior parcela dentre todas as faixas desse estado. O provável é que tenha sido um fenômeno pontual daquele ano, pois, quando foi selecionado o período acumulado, o número mudou para 27%, ficando abaixo da faixa de maiores de 60 anos (com 31%).
Outro gráfico elaborado no grupo “Perfil do Paciente” foi sobre o tabagismo, selecionando os estados da região Sudeste no ano de 2014. Esse gráfico mostrou que os pacientes residentes em São Paulo apresentaram um perfil diferente do resto da região sudeste e do Brasil, com 41% de ex-fumantes. O percentual é bem mais alto que dos outros três estados. O Rio de Janeiro, por outro lado, mostrou o maior percentual de fumantes daquela amostra, com 19% do total de pacientes.
As análises criadas no grupo “Deslocamento” evidenciaram alguns aspectos interessantes relacionados ao deslocamento. Um dos resultados encontrados ao se fazer a análise da base completa, sem filtro algum, é que a distância média de deslocamento de pacientes em tratamento de câncer de mama no Brasil foi de 88,4 km. Filtrando os dados somente do primeiro ano do período e em seguida do último, foi verificado que o deslocamento médio nacional aumentou, passando de 79,0 km no ano 2006 para 92,8 km em 2016.
Ainda considerando todo o período, foi observado que 69,5% dos deslocamentos são de até 60 km. No ano 2006, esse percentual era de 72,6%, tendo diminuído para 65,8% em 2016. Observou-se também que essa diminuição se refletiu no acréscimo das demais faixas, com destaque para a segunda (entre 61 e 200 km), que cresceu de 16,9% no primeiro ano para 21,4% no último; o que pode justificar o aumento do deslocamento médio relatado no parágrafo anterior.
Os modelos de mineração de dados criados para a discretização de variáveis também evidenciaram algumas informações relevantes sobre o deslocamento de pacientes, ainda que esse não fosse o seu propósito. Por exemplo, a discretização do atributo “Distância” mostrou que a despeito das dimensões continentais do Brasil, o tratamento de câncer de mama é concentrado em distâncias curtas (até 60 km) e médias (entre 61 e 200 km), chegando a cerca de 88% das ocorrências. Resultado bem próximo ao do estudo de Vetterlein et al. [11], que englobou todo o território norte-americano, e indicou alta concentração nas duas faixas iniciais. Naquele estudo, os autores definiram distâncias curtas como aquelas menores que 20 km, e distância média entre 20 e 80 km, encontrando 87,9%, dos casos nessas faixas.
Outro dado evidenciado foi que 47,1% das ocorrências correspondem a pacientes que tratam no seu próprio município. Esse resultado é semelhante ao encontrado por Saldanha et al. [4], que analisaram as internações e tratamentos de quimioterapia e radioterapia entre 2014 e 2016, e ao resultado encontrado no estudo de Oliveira et al. [12] para radioterapia entre os anos de 2005 e 2006. É, porém, ligeiramente menor do que o estudo de Sobreira da Silva et al. [14], que está restrito somente a quimioterapia e ao ano de 2013.
Os modelos para discretização do atributo “Dias até o Início do Tratamento” evidenciaram que as duas faixas iniciais, que indicam tratamentos em até 60 dias, englobam 40,3% dos pacientes. Aqueles que levaram mais de 60 dias para iniciar o tratamento correspondem a cerca de 48% dos casos, estando acima do resultado de 36% encontrado por Renna Junior & Azevedo e Silva [16] – o que pode ser justificado pelos critérios de exclusão utilizados por esses autores em seu artigo diferirem dos nossos.
A elaboração das análises descritivas, bem como dos modelos de discretização, evidenciaram duas potenciais limitações da ferramenta, as quais são consequências naturais das características da base de dados do RHC.
A primeira delas é a impossibilidade de calcular a distância de deslocamento intramunicipal; o que impede a análise da dinâmica de deslocamentos no município. A segunda, é o alto percentual de não preenchimento em algumas variáveis, que pode limitar futuros estudos de correlações entre o deslocamento do paciente e tais variáveis.
Apesar das limitações potenciais, a ferramenta mostrou-se eficiente na produção de informações descritivas sobre os deslocamentos dos pacientes, demonstrando assim que é possível usar o RHC como base de dados para analisar esses deslocamentos.
Conclusão
Uma ferramenta computacional que permita, de forma simples, a elaboração de gráficos e relatórios analíticos capazes de descrever os deslocamentos de pacientes em tratamento de câncer no SUS, a partir dos dados do RHC, foi implementada e validada.
Sua implementação se deu por meio de um estudo de caso de câncer de mama em que foram desenvolvidos modelos analíticos que descrevem os deslocamentos de pacientes, considerando o período de 2006 a 2016.
As análises foram agrupadas conforme características relacionadas aos tipos de tratamento, ao tumor, aos pacientes e seus deslocamentos. Esses quatro grupos de análise foram então organizados num painel de navegação interativo, disponibilizado publicamente no site www.minersus.com.br, que possibilita uma ampla gama de estudos a especialistas e gestores em saúde pública.
Assim, uma grande contribuição deste trabalho foi o desenvolvimento de um painel de análises estatísticas descritivas que permite avaliar características do deslocamento de pacientes como distância média, percentuais por faixa de deslocamento e percentuais de tratamentos dentro/fora de cada uma das unidades da Federação, suas macrorregiões, regiões de saúde, até o município.
As principais limitações da ferramenta são a impossibilidade de calcular a distância de deslocamento intramunicipal e o alto percentual de não preenchimento em algumas variáveis do RHC. No entanto, apesar dessas limitações, a ferramenta mostrou-se eficiente na produção de informações sobre os deslocamentos dos pacientes, demonstrando assim que é possível usar o RHC como base de dados para analisar esses deslocamentos.
Sugere-se como trabalho futuro a análise descritiva do deslocamento de pacientes para outros tipos de câncer. Também é proposto que seja feita a análise comparativa usando os deslocamentos calculados a partir dos sistemas de informações ambulatoriais do DATASUS.
Referências
1. Bray F, Ferlay J, Soerjomataram I, Siegel RL, Torre LA, Jemal A. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin. 2018 Nov;68(6):394-424.
2. Santos MO, Lima FCS, Martins LFL, Oliveira JFP, Almeida LM, Cancela MC. Estimativa de Incidência de Câncer no Brasil, 2023-2025. Rev. Bras. Cancerol. 2023 Jan;69(1).
3. Ministério da Saúde. Portaria no 874, de 16 de maio de 2013. Institui a Política Nacional para a Prevenção e Controle do Câncer na Rede de Atenção à Saúde das Pessoas com Doenças Crônicas no âmbito do Sistema Único de Saúde (SUS). Diário Oficial da União 17 Mai 2013.
4. Saldanha RF, Xavier DR, Carnavalli KM, Lerner K. Estudo de análise de rede do fluxo de pacientes de câncer de mama no Brasil entre 2014 e 2016. Cad. Saúde Pública; 2019 Jul;35(7).
5. Alves MO, Magalhães SCM. A geografia do câncer de mama no norte de Minas Gerais: do direito ao acesso à saúde. Hygeia. 2017 Dez;13(26):13-32.
6. Lim J, Ali AS, Prawira A, Sim HW. (2023). Impact of travel distance on outcomes for clinical trial patients: the Kinghorn Cancer Centre experience. Intern Med J. 2023 Feb; 53(2):242-249.
7. Ambroggi M, Biasini C, Del Giovane C, Fornari F, Cavanna L. Distance as a Barrier to Cancer Diagnosis and Treatment: Review of Literature. Oncologist. 2015 Dec;20(12):1378-85.
8. Fabian ID, Stacey AW, Foster A, Kivelä TT, Munier FL, Keren-Froim N, et al. Travel burden and clinical presentation of retinoblastoma: Analysis of 1024 patients from 43 African countries and 518 patients from 40 European countries. Br J Ophthalmol. 2021 Oct;105(10):1435-1443.
9. Obrochta CA, Parada H, Murphy JD, Nara A, Trinidad D, Araneta MR, Thompson C A. The impact of patient travel time on disparities in treatment for early stage lung cancer in California. PLoS One 2022 Oct;17(10).
10. Jones AP, Haynes R, Sauerzapf V, Crawford SM, Zhao H, Forman D. Travel times to health care and survival from cancers in Northern England. Eur J Cancer. 2008 Jan;44(2):269-74.
11. Vetterlein MW, Löppenberg B, Karabon P, Dalela D, Jindal T, Sood A, et al.. Impact of travel distance to the treatment facility on overall mortality in US patients with prostate cancer. Cancer. 2017 Sep;123(17):3241-3252.
12. Oliveira EXG, Melo ECP, Pinheiro RS, Noronha CP, Carvalho, MS. Acesso à assistência oncológica: mapeamento dos fluxos origem-destino das internações e dos atendimentos ambulatoriais. O caso do câncer de mama. Cad Saúde Pública. 2011 Fev;27(2):317-26.
13. Fonseca BP, Albuquerque PC, Saldanha RF, Zicker F. Geographic accessibility to cancer treatment in Brazil: A network analysis. Lancet Reg Health Am. 2021 Dec; 7(100153).
14. Sobreira da Silva MJ, Melo E, Osorio-de-Castro CGS. Fluxos origem-destino para quimioterapia para o câncer de mama no Brasil: implicações para a assistência farmacêutica. Ciênc. saúde colet. 2019 Mar;24(3):1153-1164.
15. Ministério da Saúde - Instituto Nacional de Câncer (INCA). Registros hospitalares de câncer: planejamento e gestão, 2 ed. Rio de Janeiro: INCA; 2010.
16. Renna Junior NL, Silva GAE. Diagnóstico de câncer de mama em estado avançado no Brasil: análise de dados dos registros hospitalares de câncer (2000-2012). Rev Bras Ginecol Obstet. 2018 Mar;40(3):127-136.
17. Pinto IV, Ramos DN, Costa MCE, Ferreira CBT, Rebelo MS. Completude e consistência dos dados dos registros hospitalares de câncer no Brasil. Cad. Saúde Colet. 2012; 20(1):113-20.
18. Ministério da Saúde - Instituto Nacional de Câncer (INCA). IntegradorRHC: Ferramenta para a Vigilância Hospitalar de Câncer no Brasil. Rio de Janeiro: INCA; 2011.
19. Zhuang M, Concannon D, Manley E. A Framework for Evaluating Dashboards in Healthcare. IEEE Trans Vis Comput Graph. 2022 Apr;28(4): 1715-31.