Javascript e suas Nuances
em 12 de Agosto de 2021
SCRAPING - COLETANDO DADOS NA WEB
O QUE É SCRAPING?
scraping, quer dizer na tradução livre em inglês, raspagem, que é uma limpeza de coleta de dados da web.
É uma técnica usada para coleta de informações de forma pernsonalizada e organizada.
COMO FUNCIONA?
É fácil, neste exemplo aqui eu trouxe o site da NBA para coletar o ranking de jogadores da nba que mais pontuaram na liga de Basquete.
Também dar pra coletar o time, outros dados relevantes que acabei colocando no código.
Para saber mais acesse abaixo:
AONDE É USADO O SCRAPING E ELE SERVE PRA QUÊ?
Para não esconder nada, vou direto ao ponto, quem nunca aqui que está lendo este post nunca passou
por uma experiência de anúncios em um outro site ou vídeo daquilo que você tinha pesquisado a alguns meses atrás ou até semanas, dias e anos.
É isso mesmo, o scraping você consegue criar algoritmos para fazer isso de forma que o bot(robô) saiba o site que você mais visita,
os vídeos que você mais acessa do youtube, o instagram por trás dos panos usa um algoritmo que faz isso por meio de fotos que você posta,
o bot consegue saber o que você tem mais vontade de fazer , visitar, comer, etc... É tudo baseado nas suas pesquisas que o bot consegue coletar essas informações.
COMO DESCOBRIR?
Essa uma ferramenta do Yahoo para coletar dados de uma página web com HTML(Hypertext markup language),
com ela você vai extrair uma informação de uma url por requisição web http, um protocolo de comunicação da
web.
O xpath é um caminho da onde você quer coletar esses dados, no exemplo, está coletando de uma tabela HTML.
Obs: Não existe, só esta ferramenta temos outra como a ferramenta do Desenvolvedor que fica no seu próprio navegador web.
Clicando com botão direito do mouse em cima do site que você está visitando, vá em inspect ou inspecionar e use o atalho.
Isso aí pessoal , que entender mais sobre o assunto ou quer se aprimorar , vou deixar links como referências, logo abaixo:
Raspagem de Dados: O Que É, Como Fazer e Como se Proteger (uol.com.br)
Hackeando dados públicos com Python 3 | Fernando Masanori - YouTube
Raspagem e jornalismo de dados - Escola de Dados
Como descobrir APIs escondidas para facilitar a raspagem de dados - YouTube
Obrigado por ler, até o próximo artigo e tutorial.
Gostou ? Curte, compartilha e comenta!