ss_blog_claim=beb6b6a3006a7bfdc6e6d4bceb69bf17
  

Saiba o que é Data Mining

Date abril 9, 2008


Data MiningConhecido também como mineração de dados. Sua função principal é a varredura de grande quantidade de dados a procura de padrões e detecção de relacionamentos entre informações gerando novos sub-grupos de dados. Usado comumente em grandes bancos de dados. Por enquanto podemos pensar que Data Mining é como um agregador e organizador de dados.

A formação de sub-grupos de dados é feito pelo Data Mining através da execução de algoritmos capazes de conhecer e aprender mediante a varredura dessas informações. Baseado em sistemas de redes neurais, esses dados são examinados e pensados, gerando uma nova informação associativa com outros dados. A formação de estatísticas também é uma de suas funções. Números estatísticos são gerados trazendo resultados comparativos e levando a uma tomada de decisão inteligente.

É gigantesco o resultado desse processamento, uma das mais fortes é a formação de hipóteses e principalmente regras de dados a serem apresentados ao usuário. Falaremos como isso é exibo um pouco mais pra frente.

Que dados o Data Mining avalia?

Grandes corporações não sobrevivem sem um perfeito sistema de gestão. Perfeito pelo motivo de que hoje em dia milhares de informações são processadas diariamente. Na rotina de pequenas e médias empresas essas informações ficam perdidas e esquecidas. Esses sistemas de gestão armazenam em seus bancos de dados os acontecimentos do dia-a-dia: estoques, pedidos, compras, orçamentos, contábil, financeiro, jurídico, pós-venda, relacionamento com cliente, vendas entre outros. Todos esses departamentos geram informações independentes. A função principal de um Business Intelligence é trabalhar todo esse histórico de acontecimentos inseridos diariamente e garantir que no final das contas todos os dados sejam visualizados como um todo, trazendo informações concretas, consistentes e decisivas, basicamente através da ação do Data Mining.

Pra onde vai?

Essa mineração de informação na base de dados do sistema resulta -como já mencionado- em novas informações mais detalhadas e principalmente organizada (dependendo muito do algoritmo sendo executado). O Data Mining alimenta uma base de dados já comentada aqui no Alvo Conhecimento: o Data Warehouse, base única e totalmente estruturada para garantir a tomada de decisão em nível de usuário, através de relatórios customizados. Saiba mais sobre Data Warehouse aqui.

Como é feita a mineração?

Essa varredura nos dados “históricos” requer que eles sejam filtrados a fim de desconsiderar o que é específico sobre algum assunto e valorizar tudo que for generalizado dentro do sistema, ou dados genéricos. Se por acaso uma faculdade recebe muitos pedidos de descontos num determinado dia, significa que houve uma procura comum, e não uma regra sobre “pedir descontos em um dia especifico”. O que quero dizer é que não há ma associação entre pedido de desconto e dia específico como uma regra. O que importa para o Data Mining é que em um determinado dia houve um padrão de acontecimentos, e isso ele ira considerar.

É simples, para localizar os padrões de um sistema, basta iniciarmos naqueles que se repetem. Por quê? Como diz na Wikipédia: “O cérebro dos seres humanos utiliza-se de processos similares, pois muito do conhecimento que temos em nossa mente é, de certa forma, um processo que depende da localização de padrões”.

Finalizando

O assunto é bem amplo, meu objetivo aqui é trazer uma noção geral. Nada impede de continuarmos em outros posts. Existem muitas referências na internet sobre Data Mining e como criar esses algoritmos de uma forma que apresente a melhor solução para sua aplicação.

Algumas dessas referências:

Data Mining – Home Page
Open Directory Projeto (Data Mining)
Programa de Mineração de Dados – Universidade da Flórida
Lista de profissionais que trabalham com Data Mining
Tutoriais

Leitura Recomendada:

Data Mining Livro 1 dm2.jpg



  • email
  • Print
  • RSS
  • del.icio.us
  • Google Bookmarks
  • Rec6
  • Digg
  • Technorati
  • Live
  • Facebook
  • LinkedIn
  • MySpace
  • Netvibes
  • Tumblr
  • Twitter
  • FriendFeed
  • Identi.ca
  • Reddit
    

15 Comentários em “Saiba o que é Data Mining”

  1. Fábio de Salles disse:

    Prezado, com todo respeito ao senhor e ao seu conhecimento, acho que data mining (garimpagem de dados) é muitas coisas, menos “Por enquanto podemos pensar que Data Mining é como um agregador e organizador de dados.” A definição estava boa até aí. Para que tentar simplificar demais? Sem esse trecho, ficaria muito boa. Especialmente porque os termos agregação e organização têm muitos significados para servir à garimpagem de dados…

    [Responda este comentário]

    Danilo TomazResposta:

    O data Mining também é o responsável por apresentar as informações por ex. via gráfico ou esta função é de outra ferramenta ?

    [Responda este comentário]

    PradoResposta:

    Não. Veja http://www.pentaho.com.

    [Responda este comentário]

  2. Daniel Accorsi disse:

    Olá Fábio, obrigado pela participação
    Entendo sua colocação sobre simplificar. Muitas vezes um conceito quando explicado de maneira muito simples causa um certo conflito com grandes entendedores, acredito que você seja um deles. Os termos básicos já não fazem parte de sua realidade.

    Agregador porque agrega ou reune dados. Além de reunir ele cria um padrão de organização. A explicação é simples sim, por esse motivo foi comentado no começo “Por enquanto podemos pensar…”, afinal, há ainda um artigo inteiro pela frente.

    Abração e continue visitando. Estou planejando novos posts.

    [Responda este comentário]

  3. Diva Fatima disse:

    Boa tarde! acho que todos os posts são de suma importancia, atraves deles conhecemos e aprendemos algo de novo, eu mesma nunca tinha visto falar em Data Mining e quero buscar todas as informações possiveis para enriquecer meu conhecimento e estar informada cada vez mais.
    Parabens pela iniciativa de colocar materiais tão importantes a disposição.

    Atenciosamente,
    Diva Fatima

    [Responda este comentário]

  4. Sonia disse:

    Estou gostando dessa aula web, sei que vai aumantar o nosso aprendizado, princilpamente porque está sendo colocando muitos sites de informações precisas.

    [Responda este comentário]

  5. Mariana disse:

    Boa Noite Srs. Achei muito interessante essa aula sobre o Data Mining.
    Estou Cursando faculdade de marketing e esse eh um dos assuntos o qual nos estamos abordando no momento, e a matéria me foi muito útil.

    Muito Obrigada

    [Responda este comentário]

  6. Prado disse:

    Pelamordedeus. “Pra onde vai? (…)O Data Mining alimenta uma base de dados já comentada aqui no Alvo Conhecimento: o Data Warehouse, base única e totalmente estruturada para garantir a tomada de decisão em nível de usuário, através de relatórios customizados.(…)” NÃO!!! DATA MINING não alimenta um DATA WAREHOUSE!! EM HIPÓTESE ALGUMA!!! DATA MINING gera fórmulas! Data Warehouse é alimentado por um processo de ETL! DATA MINING CONSOME DADOS DE UM DW! Ele errou o básico! E outra, só acadêmico acha que data mining é baseado em sistemas neurais. Quem conhece o assunto sabe que é muito mais que isso!!

    [Responda este comentário]

    Daniel AccorsiResposta:

    Olá Prado, obrigao pelo seu comentário, sempre crescemos com os retornos.

    Mas deixa eu esclarecer uma situação aqui. Vou acabar escrevendo uma segunda parte sobre Data Mining, dessa vez um pouco mais avançado. Já passei por uma situação parecida como essa nesse artigo, é comum. Acontece que meu foco quando escrevi sobre Data Mining é conseguir (foi difícil) esclarecer de uma forma bem natural e principalmente passar uma visão bem ampla do assunto sem definir qualquer conceito mais avançado, além destes já mencionados. Claro que temos a questão da ETL como meio dessa alimentação. Uma Data Mining não passa de um algoritmo de exploração de dados, dentre tantos por aí, todos com sua alta complexidade e fins específicos.

    Vou estar inserindo uma nota no início do texto para deixar claro o objetivo do post. E outra coisinha, sobre questões acadêmica, fico feliz se o post está sendo usado como fonte de algum trabalho ou bibliografia acadêmica, mas o blog Alvo Conhecimento não tem nenhum vínculo com qualquer instituição de ensino.

    [Responda este comentário]

  7. Juarez Neves disse:

    Daniel, poderia me fornecer com toda certeza, em que área pode ser aplicado o Data Minig, pois gerou, aqui na empresa onde trabalho, dúvidas de que seja no campo da Administração.
    Abçs

    [Responda este comentário]

    Daniel AccorsiResposta:

    Olá Juarez. Desculpe a demora!
    Se é que entendi sua pergunta. Esses dados ajudam em todas as áreas de uma empresa, digo quando após finalizado todo o processo de mineração chegando a um “repositório” com os dados organizados (Datawarehouse). Como nosso amigo aí em baixo comentou, pode ser também usado no mkt de uma empresa para tomada de decisão em alguma campanha publicitária. Apenas esclarecendo, o data mining são algoritmos de mineração para gerar um datawarehouse.

    Continue participando.

    [Responda este comentário]

  8. Daniel Almeida das Chagas disse:

    A data Minig no meu ponto vista ajuda bastante um profissional de MKT porquer e uma ferramente bastante útil dentro de uma empresa pois já tras informações filtradas da Warehouse.

    [Responda este comentário]

    Daniel AccorsiResposta:

    Olá Daniel Almeida!
    Bom exemplo sobre o mkt.
    Veja minha resposta ao Juarez, logo acima, também referente ao esclarecimento.

    [Responda este comentário]

  9. radinha disse:

    o que é datas

    [Responda este comentário]

  10. lucas disse:

    Oi Daniel, gostei de sua explicação,parabéns pelo trabalho. Estou com uma dúvida?
    O data ming pode se comparar com Fin web,ou uma intranet chamada PE Xchng,ou é um complemento disso tudo!

    Obrigado pela Atenção!

    [Responda este comentário]

Deixe seu comentário

ss_blog_claim=beb6b6a3006a7bfdc6e6d4bceb69bf17