Your Web News in One Place

Help Webnuz

Referal links:

Sign up for GreenGeeks web hosting
June 23, 2021 06:16 pm GMT

Machine Learning Descomplicado

generated with Summaryze Forem

O que Machine Learning?

Quando se fala em tecnologia, um termo que est na boca do povo aprendizado de mquina (machine learning em ingls). Mas o que exatamente isso? Uma busca simples no Google, retorna uma multitude de artigos, fruns, documentos, fontes.

Existem inmeras definies sobre o que o aprendizado de mquina, mas uma que nos serve bastante por agora : A pesquisa em aprendizado de mquina um campo de estudo dentro da pesquisa em inteligncia artificial, que busca fornecer conhecimento aos computadores atravs de dados, observaes e interaes com o mundo. Esse conhecimento adquirido permite que computadores generalizem corretamente novos eventos e configuraes.

Sendo assim, o intuito deste post introduzir voc que est lendo, a esse mundo maravilhoso que ser nosso futuro. Hoje, voc aprender como abrir um dado e visualizar as principais informaes dele.

Primeiros passos

Agora que voc est introduzido neste mundo, vamos nos preparar para comearmos nossa explorao. Primeiro, precisamos definir qual ser nossa base de dados, para este projeto, fiz uma adaptao na base de dados chamada de credit data, hospedada no site Kaggle.

Aps baixar a base, vamos importar as bibliotecas que utilizaremos durante todo o processo.

  1. Pandas;
  2. Numpy;
  3. Seaborn;
  4. Matplotlib.pyplot;
  5. ploty.express.

Usaremos a biblioteca pandas e numpy para o processamento dos dados e clculos estatsticos. A seaborn, matplotlib e a ploty, usamos na parte da visualizao dos dados. Tudo explicado, agora vamos importar as bibliotecas no nosso cdigo:

import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltimport plotly.express as px

Sempre que importamos uma biblioteca, passamos um apelido para ela, para que fique mais fcil nossa utilizao, e isso que o as pd, as np, e os demais significam.

Leitura da Base

Aps importado as bibliotecas, vamos finalmente abrir nossa base pela primeira vez. Para isso, utilizaremos a biblioteca pandas e seu mtodo read_csv.

base_credit = pd.read_csv('credit_data.csv')

Adicionamos esse mtodo em uma varivel, e passamos o path do arquivo como parmetro.
Agora vamos fazer nossa primeira visualizao, para isso, utilizaremos o comando .head() do prprio pandas. Ele nos retornar as 5 primeiras linhas do arquivo.

base_credit.head()

Sada: image
Podemos ver que temos uma tabela, com 6 colunas.

  1. A primeira coluna corresponde ao ndice da nossa tabela, qual o tamanho dela;
  2. A segunda coluna (clientid) corresponde ao id do cliente;
  3. A terceira coluna (income) corresponde ao salrio do respectivo cliente ao ano.
  4. A quarta coluna (age), mostra a idade do cliente;
  5. A quinta coluna (loan), representa o valor da dvida que o cliente est devendo;
  6. E por ultimo, a sexta coluna, representa se o cliente quitou, ou no, a dvida. Esses valores so representados por 1 e 0, respectivamente.

Explorao dos dados - incio

Para fazer a explorao, utilizaremos o comando describe, do pandas. Ele retornar diversas informaes estatsticas dos valores nmeros existentes na nossa tabela.

base_credit.describe()

Sada: image
Com esse comando podemos observar a quantidade de linhas contidas na tabela, a mdia de cada uma das colunas, o desvio padro, o valor mnimo encontrado, o primeiro quartil de 25%, a mediana, o segundo quartil de 75% e o valor mximo encontrado.

Resumo

E aqui finalizamos o post de hoje. Neste post, foi mostrado uma ideia geral sobre machine learning e os primeiros passos para construir um projeto nesta rea. Ao longo da semana as demais partes iro sair, espero que acompanhem! At a prxima!!


Original Link: https://dev.to/devshy/machine-learning-descomplicado-h1e

Share this article:    Share on Facebook
View Full Article

Dev To

An online community for sharing and discovering great ideas, having debates, and making friends

More About this Source Visit Dev To