Webscraping Python
Foto de Lucas M.
Por: Lucas M.
18 de Setembro de 2021

Webscraping Python

A Raspagem Na Web

Python webscraping Programação Python

                                                                       SCRAPING - COLETANDO DADOS NA WEB

 

O QUE É SCRAPING? 

scraping, quer dizer na tradução livre em inglês, raspagem, que é uma limpeza de coleta de dados da web. 

É uma técnica usada para coleta de informações de forma pernsonalizada e organizada.

 

COMO FUNCIONA?

É fácil, neste exemplo aqui eu trouxe o site da NBA para coletar o ranking de jogadores da nba que mais pontuaram na liga de Basquete.

Também dar pra coletar o time, outros dados relevantes que acabei colocando no código.

Para saber mais acesse abaixo:

CÓDIGO GITHUB

 

AONDE É USADO O SCRAPING E ELE SERVE PRA QUÊ?

Para não esconder nada, vou direto ao ponto, quem nunca aqui que está lendo este post nunca passou

por uma experiência de anúncios em um outro site ou vídeo daquilo que você tinha pesquisado a alguns meses atrás ou até semanas, dias e anos.

É isso mesmo, o scraping você consegue criar algoritmos para fazer isso de forma que o bot(robô) saiba o site que você mais visita, 

os vídeos que você mais acessa do youtube, o instagram por trás dos panos usa um algoritmo que faz isso por meio de fotos que você posta, 

o bot consegue saber o que você tem mais vontade de fazer , visitar, comer, etc... É tudo baseado nas suas pesquisas que o bot consegue coletar essas informações. 

 

COMO DESCOBRIR?

Essa uma ferramenta do Yahoo para coletar dados de uma página web com HTML(Hypertext markup language), 

com ela você vai extrair uma informação de uma url por requisição web http, um protocolo de comunicação da 

web. 

O xpath é um caminho da onde você quer coletar esses dados, no exemplo, está coletando de uma tabela HTML.

 

Scraping HTML table data in YQL | Tony Hirst | Flickr

 

Obs: Não existe, só esta ferramenta temos outra como a ferramenta do Desenvolvedor que fica no seu próprio navegador web. 

Clicando com botão direito do mouse em cima do site que você está visitando, vá em inspect ou inspecionar e use o atalho.

 

Isso aí pessoal , que entender mais sobre o assunto  ou quer se aprimorar , vou deixar links como referências, logo abaixo:

 Raspagem de Dados: O Que É, Como Fazer e Como se Proteger (uol.com.br)

Hackeando dados públicos com Python 3 | Fernando Masanori - YouTube

Raspagem e jornalismo de dados - Escola de Dados

Como descobrir APIs escondidas para facilitar a raspagem de dados - YouTube

 

Obrigado por ler, até o próximo artigo e tutorial.

Gostou ? Curte, compartilha e comenta!

Lucas M.
Lucas M.
Maceió / AL
Responde em 8 h e 15 min
Identidade verificada
4,5
nota média
38
avaliações
R$ 75
por hora
Especialização: Pós-graduação em Desenvolvimento de Sistemas com Python (Unicesumar)
Python - Avançado, Python - Estruturas de decisão, Python - Data Science
Aulas presenciais e online de ciências de dados, programação web e inteligência artificial com foco em projetos reais.

Confira artigos similares

Aprenda sobre qualquer assunto