Om Abordagem de Extracção de Dados Baseada Na Extracção de Fluxos
O Clustering é uma das técnicas mais importantes na extração de dados. O seu objetivo é dividir os dados em grupos de objectos semelhantes. São designados por clusters. Esta investigação compara o algoritmo StreamKM++ com os trabalhos existentes, tais como AP, IAPKM e IAPNA. O algoritmo StreamKM++ é um novo algoritmo de clustering a partir do fluxo de dados e constrói um bom clustering do fluxo, utilizando uma pequena quantidade de memória e tempo. Muitos investigadores trabalharam com algoritmos de clustering estáticos, mas em tempo real os dados são dinâmicos por natureza. Por isso, a técnica estática convencional não é compatÃvel com o ambiente de tempo real. Neste trabalho, é utilizado o algoritmo StreamKM++, que atinge um elevado desempenho de agrupamento em relação ao AP tradicional, ao IAPKM e ao IAPNA. Os resultados experimentais mostram que o algoritmo StreamKM++ obtém os melhores resultados em comparação com os trabalhos existentes. Aumentou a taxa de precisão média e reduziu o tempo de computação, a memória e o número de iterações.
Vis mer