<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
<channel>
<title>Dissertações</title>
<link>https://hdl.handle.net/1884/39741</link>
<description/>
<pubDate>Wed, 03 Jun 2026 17:29:58 GMT</pubDate>
<dc:date>2026-06-03T17:29:58Z</dc:date>
<item>
<title>Similarity operators for detecting denial constraint violations</title>
<link>https://hdl.handle.net/1884/105229</link>
<description>Similarity operators for detecting denial constraint violations
Resumo: A detecção de violações a restrições de integridade (ICs) é uma tarefa importante na limpeza de dados. Existem vários tipos de ICs, cada um deles expressando um conjunto diferente de restrições. Um tipo bem estudado de IC são as restrições de negação (DCs), que podem expressar umgrande conjunto de restrições. Entretanto, DCs podem falhar em detectar violações quando na presença de dados textuais ruidosos, i.e., dados textuais contendo valores diferentes para representar a mesma entidade do mundo real. A existência de diferentes representações da mesma entidade pode ser causada, por exemplo, por erros de digitação, acrônimos, ou abreviações. Apesar da existência de vários sistemas para detectar violações de DCs, nenhum deles ataca o problema de detectar violações na presença de dados ruidosos. Além disso, outros tipos de ICs já foram propostos para lidar com dados ruidosos, mas nenhum deles pode expressar o mesmo conjunto de restrições representadas por DCs. Para atacar essas limitações das abordagens anteriores na detecção de violações a ICs, nós exploramos o uso de operadores de similaridade para detectar violações a DCs ao apresentar o Similarity FAst Constraint-based Error DeTector (SimFACET), um detector de violações a DCs com similaridade. Ele avalia eficientemente DCs contendo predicados com operadores de similaridade usando algoritmos exatos e aproximados para executar junções por similaridade. Para determinar a similaridade entre dados textuais, o detector suporta distância de edição entre dados textuais e distância de cossenos entre text embeddings. Nós também exploramos diferentes estratégias para o planejamento da order de processamento dos predicados de similaridade, tentando balancear custo de avaliação e a seletividade dos predicados para reduzir o tempo total de detecção. Para avaliar os algoritmos e estratégias propostos, nós conduzimos experimentos entre múltiplos datasets e utilizando DCs com diferentes características. Os resultados mostram que o SimFACET mantém alta acurácia enquanto consistentemente reduz o tempo de detecção, executando até 4× mais rápido do que versões de base; Abstract: The detection of integrity constraints (ICs) violations is an important task in data cleaning. There are many types of ICs, each of them capable of expressing different sets of constraints. A well-studied type of IC are denial constraints (DCs), which can express a large set of constraints. However, DCs can fail in detecting violations when in the presence of noise string data, i.e., string data containing different values to represent the same real-world entity. The existence of these different representations of the same entity may be caused, for example, by typos, acronyms, or abbreviations. Despite the existence of several systems to detect DC violations, none of them addresses the problem of detecting violations in the presence of noisy data. Furthermore, other IC types have already been proposed to deal with noisy data, but none of them can express the same set of constraints represented by DCs. To address these limitations of the previous approaches in the detection of IC violations, we explore the use of similarity operators for detecting DC violations by presenting Similarity FAst Constraint-based Error DeTector (SimFACET), a violations detector for similarity DCs. It efficiently evaluates DCs containing predicates with similarity operators using exact and approximate algorithms for performing similarity joins. To determine string similarity, the detector supports edit distance between strings and cosine distance between text embeddings. We also explore different strategies for planning the processing order of the similarity predicates, trying to balance the evaluation cost and the selectivity of predicates to reduce the overall detection time. To evaluate the proposed algorithms and strategies, we have conducted experiments across multiple datasets and using DCs with different characteristics. The results show that SimFACET maintains high accuracy while consistently reducing detection time, executing up to 4× faster than baselines
Orientador: Eduardo Cunha de Almeida; Coorientador: Eduardo Henrique Monteiro Pena; Banca: Eduardo Cunha de Almeida (Presidente da Banca), Daniel Kaster, Simone Dominico e Eduardo Henrique Monteiro Pena; Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 27/02/2026; Inclui referências; Área de concentração: Ciência da Computação
</description>
<pubDate>Thu, 01 Jan 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">https://hdl.handle.net/1884/105229</guid>
<dc:date>2026-01-01T00:00:00Z</dc:date>
</item>
<item>
<title>Alicerces conceituais para uma proposta de portal nacional de glossários terminológicos científicos na Libras</title>
<link>https://hdl.handle.net/1884/101917</link>
<description>Alicerces conceituais para uma proposta de portal nacional de glossários terminológicos científicos na Libras
Resumo: A Lei n.º 10.436, de 24 de abril de 2002 instituiu a Libras como direito legal de comunicação e expressão das pessoas surdas no país. O Decreto 5.626/2005 estabeleceu esta determinação, e a Lei 12.319/2010 regulamentou a profissão de intérprete Português-BR-Libras. Desde então, diversos esforços vêm sendo empreendidos por pesquisadores da Libras, da Educação Bilíngue, do Processamento de Linguagem Natural e da Informática na Educação, para prover os estudantes surdos dos meios necessários à condição de igualdade de oportunidades na Educação. No entanto, ainda persiste o problema da falta de repositórios de glossários terminológicos científicos unificados nacionalmente. Este problema se manifesta no cotidiano dos intérpretes por meio da falta de sinais-termo para expressar conceitos nas diversas áreas do conhecimento, e pela multiplicidade de sinais-termo existentes para um mesmo conceito o que, na ciência, não deve acontecer, sob risco de comprometer a plena participação dos estudantes e dos docentes surdos na construção de conhecimentos científicos. Diante desse contexto, a pesquisa que teve como resultado esta minuta de dissertação teve por objetivo a construção dos alicerces conceituais para um Portal de glossários terminológicos científicos bilíngue. Como métodos para atingir o objetivo, foram realizados dois mapeamentos sistemáticos de literatura, o primeiro para investigar a possível existência de glossários na Libras da área da Grande Área da Computação, e o segundo para abarcar, também, as demais áreas do conhecimento. Ao encontrarmos artigos que não cumpriam os critérios de inclusão desses mapeamentos, mas que se mostraram pertinentes para os nossos objetivos, fizemos, ademais, uma revisão dos mesmos e algumas buscas diretas em recursos virtuais disponíveis, tanto de material teórico quanto de ferramentas. Todos os estudos comprovaram a inexistência de suportes com essa característica, determinando o espaço para a proposição de seus alicerces conceituais. Os alicerces contemplam os valores norteadores, as hipóteses de pesquisa, a proposta de uma organização comunitária e os perfis de atores, e delineiam as etapas do processo de construção; Abstract: Law No. 10,436 of April 24, 2002 established Brazilian Sign Language (Libras) as a legal right of communication and expression for deaf individuals in the country. Decree No. 5,626/2005 implemented this provision, and Law No. 12,319/2010 regulated the profession of Portuguese BR-Libras interpreters. Since then, numerous efforts have been undertaken by researchers in the fields of Libras, Bilingual Education, Natural Language Processing, and Educational Informatics to ensure equal educational opportunities for deaf students. However, the lack of nationally unified repositories of scientific terminological glossaries remains a persistent challenge. This problem manifests itself in the daily work of interpreters through the lack of sign-terms to express concepts in various areas of knowledge, as well as the coexistence of multiple technical signs for a single concept, an inconsistency that, in scientific contexts, compromises the full participation of deaf students and teachers in the construction of scientific knowledge. In this context, the present research that flew out in this is manuscript had as its main objective to build the conceptual foundations for a bilingual portal of scientific terminological glossaries. To achieve this objective, two systematic literature mappings were conducted: the first to investigate the possible existence of glossaries in Libras in the field of Computing, and the second to also encompass other areas of knowledge. During this process, works that did not meet the inclusion criteria of the mappings but were relevant to the research objectives were also reviewed, along with direct searches in available virtual resources, encompassing both theoretical materials and technological tools. The findings confirmed the absence of repositories with these characteristics, thereby justifying the development of their conceptual underpinnings. These foundations encompass guiding values, research hypotheses, the proposal of a community-based organizational model and actor profiles, and outline the stages of the construction process
Orientadora: Prof(a). Dra. Laura Sánchez García; Coorientador(a): Prof(a). Dra. Tanya Amara Felipe de Souza; Banca: Laura Sánchez García (Presidente da Banca), Tanya Amara Felipe de Souza, Eduardo Todt e Daniela de Freitas Guilhermino Trindade; Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 19/02/2026; Inclui referências
</description>
<pubDate>Thu, 01 Jan 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">https://hdl.handle.net/1884/101917</guid>
<dc:date>2026-01-01T00:00:00Z</dc:date>
</item>
<item>
<title>Investigação de técnicas de aprendizagem de máquina no pós processamento de previsões de rajada de vento e detecção de evento severo</title>
<link>https://hdl.handle.net/1884/101888</link>
<description>Investigação de técnicas de aprendizagem de máquina no pós processamento de previsões de rajada de vento e detecção de evento severo
Resumo: A previsão de rajadas de vento apresenta grandes desafios devido à sua alta variabilidadeespaço-temporal e ao seu significativo potencial destrutivo. Este trabalho investigou a aplicaçãode técnicas de Aprendizagem de Máquina (AM) no pós-processamento de previsões numéricasdo tempo, especificamente do modelo Integrated Forecasting System (IFS), com o objetivode aprimorar a acurácia das previsões no estado do Paraná utilizando-se apenas variáveis desuperfície como preditores. Foram avaliadas cinco arquiteturas distintas — Regressão Linear,Long Short-Term Memory (LSTM), Redes Neurais Convolucionais (CNN), Transformer eSupport Vector Machine (SVM) — utilizando dados observacionais de estações meteorológicase previsões por conjunto (ensemble) entre os anos de 2021 e 2024. A metodologia abordouo problema sob a perspectiva da correção da magnitude da rajada via regressão e também aidentificação de eventos severos através da detecção de anomalias. Os resultados demonstraramque, embora os modelos de AM tenham sido eficazes na redução dos erros globais e no aumentoda correlação em comparação à previsão bruta do IFS, eles tenderam a suavizar a variabilidadedos dados, falhando em capturar a magnitude dos eventos extremos. A detecção de anomalias viaSVMapresentou limitações, com altas taxas de falsos positivos. Conclui-se que o uso exclusivode variáveis de superfície do modelo numérico é insuficiente para a previsão de rajadas severas,indicando a necessidade de incorporar informações sobre a estrutura vertical da atmosfera parasuperar as limitações físicas na previsão destes extremos; Abstract: Wind gust forecasting presents major challenges due to its high spatiotemporal variability andsignificant destructive potential. This work investigated the application of Machine Learning (ML)techniques in the post-processing of numerical weather predictions, specifically the IntegratedForecasting System (IFS) model, with the objective of improving forecast accuracy in thestate of Paraná using only surface variables as predictors. Five distinct architectures wereevaluated — Linear Regression, Long Short-Term Memory (LSTM), Convolutional NeuralNetworks (CNN), Transformer, and Support Vector Machine (SVM) — using observational datafrom meteorological stations and ensemble forecasts between the years 2021 and 2024. Themethodology approached the problem from the perspective of correcting gust magnitude viaregression and also identifying severe events through anomaly detection. The results demonstratedthat, although the ML models were effective in reducing global errors and increasing correlationcompared to the raw IFS forecast, they tended to smooth data variability, failing to capture themagnitude of extreme events. Anomaly detection via SVM presented limitations, with high falsepositive rates. It is concluded that the exclusive use of surface variables from the numericalmodel is insufficient for forecasting severe gusts, indicating the need to incorporate informationregarding the vertical structure of the atmosphere to overcome physical limitations in predictingthese extremes
Orientador: Luiz Eduardo Soares de Oliveira; Banca: Luiz Eduardo Soares de Oliveira (Presidente da Banca), Leonardo Calvetti e Marco Antonio Zanata Alves; Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 10/03/2026; Inclui referências; Área de concentração: Ciência da Computação
</description>
<pubDate>Thu, 01 Jan 2026 00:00:00 GMT</pubDate>
<guid isPermaLink="false">https://hdl.handle.net/1884/101888</guid>
<dc:date>2026-01-01T00:00:00Z</dc:date>
</item>
<item>
<title>Data Warehousing : uma experiência na construção de um Data Mart</title>
<link>https://hdl.handle.net/1884/101881</link>
<description>Data Warehousing : uma experiência na construção de um Data Mart
Resumo: A apresentação deste trabalho consiste de uma exposição teórica sobre a tecnologia de Data Warehouse e a experiência na construção de um Data Mart. Na revisão bibliográfica é dada uma visão sobre o assunto, desde o seu conceito, mostrando os benefícios e componentes, passando pela Arquitetura até a Modelagem. Após finalizada esta primeira parte é mostrado um caso prático de construção de um Data Mart para uma Instituição Financeira e são comentadas as diversas partes do projeto
Orientador:  Prof. Dr. Martin A Musicante; Monografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Informática; Inclui referências
</description>
<pubDate>Thu, 01 Jan 2004 00:00:00 GMT</pubDate>
<guid isPermaLink="false">https://hdl.handle.net/1884/101881</guid>
<dc:date>2004-01-01T00:00:00Z</dc:date>
</item>
</channel>
</rss>
