• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
10.11606/T.17.2013.tde-26032014-103153
Document
Author
Full name
Flavio Barbosa
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
Ribeirão Preto, 2013
Supervisor
Committee
Muglia, Valdair Francisco (President)
Elias Júnior, Jorge
Oliveira, Harley Francisco de
Rangel, Alexandre Leite
Traina, Agma Juci Machado
Title in Portuguese
Metodologia para estruturação de informações de laudos radiológicos
Keywords in Portuguese
estruturação da informação
Laudo radiológico
ontologia
terminologia
texto livre
Abstract in Portuguese
Introdução: O laudo radiológico com entrada de dados estruturada proporciona precisão na recuperação de informações, todavia, é menos abrangente que o texto-livre e pode impedir o especialista de descrever um achado importante, não contemplado pela estrutura pré-definida. Portanto, a solução está em interpretar o texto escrito pelo especialista e os transportar para uma estrutura computacional ontológica formalizando o conhecimento. Objetivos: Elaborar e avaliar uma metodologia para estruturação de informações de laudos radiológicos em texto livre que contemple as especificidades brasileiras, incluindo a terminologia empregada. Métodos: Coleta de 1701 laudos radiológicos de ressonância magnética da coluna lombossacra em três instituições distintas. Para estruturar a informação, foram utilizadas técnicas de mineração de texto e conceituação ontológica das unidades lexicais. Dez radiologistas especialistas avaliaram a superestrutura textual e a terminologia extraída e conceituada, por meio de questionário eletrônico onde foram sugeridas 3 superestruturas textuais e 30 termos com a descrição do respectivo conceito. Resultados: A metodologia criada é constituída por 6 passos: 1) coleta dos laudos radiológicos de determinado tipo de exame; 2) decomposição textual; 3) normalização das unidades lexicais; 4) identificação das superestruturas textuais; 5) conceituação dos termos candidatos; 6) avaliação das superestruturas identificadas e da terminologia extraída e conceituada pelos especialistas na linguagem de especialidade estudada. Foram identificadas três superestruturas textuais diferentes. Após processamento automático inicial, 6129 unidades lexicais foram normalizadas obtendo 4568 termos candidatos dos quais 4183 foram conceituados e originaram 727 conceitos. Foram estabelecidas 13963 relações entre termos candidatos e conceitos, e 789 relações entre conceitos. Quanto a adequada descrição dos termos, 40% dos avaliadores concordam plenamente que estão adequados, 60% concordam parcialmente que estão adequados e nenhum avaliador discordou que os termos são adequados. Em relação a quantidade de termos utilizados pelos avaliadores, em sua respectiva instituição, 70% utilizam de 24 a 30 termos e 30% de 16 a 23 termos. A conceituação de um termo foi considerada inadequada por dois avaliadores. Conclusão: A metodologia proposta foi avaliada por radiologistas especialistas que identificaram as diferenças das superestruturas textuais entre as instituições e os termos com a descrição do respectivo conceito. Portanto, foi possível estruturar a informação de laudos radiológicos da coluna lombossacra a partir do texto livre identificando as superestruturas textuais, extraindo as unidades lexicais, normalizando as unidades lexicais e conceituando ontologicamente os termos candidatos preservando a referência com as respectivas partes constituintes dos laudos radiológicos produzidos no contexto brasileiro.
Title in English
Methodology for structuring information from radiological reports
Keywords in English
free-text
ontology
Radiological report
structuring information
terminology
Abstract in English
Introduction: The radiological report with structured data entry provides precision in information retrieval, however, is less comprehensive than the text-free and may prevent the expert to describe an important finding, not covered by the pre-defined structure. So the solution is to interpret the text written by expert and carry for a computational framework formalizing the ontological knowledge. Objectives: Develop and evaluate a methodology for structuring information in free text radiology reports that contemplates the Brazilian specifications, including terminology. Methods: 1701 radiological reports of lumbosacral MRI were collected in three different institutions. To structure the information we used techniques of text mining and ontological conceptualization of lexical units extracted. Ten dedicated radiologists evaluated the textual superstructure and terminology extracted by the electronic questionnaire which were suggested textual 3 superstructures and 30 terms with the description of its concept. Results: The established methodology consisted of six steps: 1) collection of radiology reports of certain type of examination; 2) textual decomposition; 3) lexical units normalization; 4) textual superstructures identification ; 5) conceptualization of candidate terms; 6) evaluation of identified superstructures and terminology extracted by experts in the specialized language study. We identified three different textual superstructures. After automatic processing initial 6129 lexical units were normalized getting 4568 candidate terms of which 4183 were conceptualized and originated 727 concepts. 13963 were established relations between candidate terms and concepts and 789 relations between concepts. As for adequate description of the terms, 40% of the evaluators agree fully that are appropriate, 60% somewhat agree that they are adequate and no evaluator disagreed that the terms are adequate. Regarding the number of words used by evaluators in their respective institution using 70% between 24 and 30 terms and 30% from 16 to 23 terms. The conceptualization of a term was considered inadequate by two evaluators. The established methodology consisted of six steps: 1) collection of radiology reports of certain type of examination; 2) textual decomposition; 3) lexical units normalization; 4) textual superstructures identification ; 5) conceptualization of candidate terms; 6) evaluation of identified superstructures and terminology extracted by experts in the specialized language study. Conclusions: The proposed methodology was evaluated by radiologists who identified the differences between the textual superstructures institutions and the terms describing the relevant concept. Therefore, it was possible to structure the information of the lumbosacral spine radiology reports from free text by identifying textual superstructures, extracting lexical units, normalizing the lexical units and conceptualizing the terms ontologically candidates preserving the reference to the respective constituent parts of radiology reports produced in the Brazilian context.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2014-04-07
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
Centro de Informática de São Carlos
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2021. All rights reserved.