class: center, middle, inverse, title-slide # Webscraping como ferramenta metodológica para as ciências sociais ### Universidade Federal da Bahia - LABHDUFBA ### 2021-03-09 --- layout: true --- class: middle, center -- # Pressupostos do webscraping <br> -- ## Computação ubíqua/digitalização <br> -- ## dataficação <br> -- ## --- class: middle, center -- # Web Scraping <br> -- ## Coleta automatizada de dados na WEB através do uso de "scrapers" <br> -- ## É diferentes de "tirar prints"! --- class: middle, center -- # Scrapers <br> -- ## Scrapers são códigos/scripts ( em linguagens de programação) que possibilitam o download automático de dados da Web e a captura de algumas das grandes quantidades de dados sobre a vida social disponíveis na web. --- class: middle, center -- # Webscraping como "processo de destilação" <br> -- ## como extrair dados úteis(heurísticos) de um conjunto heterogêneo de infos? <br> -- ## Raspagem consiste na exclusão dos "elementos inúteis" de modo a produzir um conjunto de dados bem ordenado e utilizável; <br> -- ## Depois da raspagem uma série de etapas adicionais se seguem, nas quais os dados são limpos em operações sucessivas --- class: middle, center -- # Webscraping: "técnica de coleta de dados" ou "dispositivo analítico"? <br> -- ## Todo scraper possui uma "epistemologia" dentro dele <br> -- ## Redução da complexidade, heterogeneidade, "sujeira" <br> -- ## Intercâmbio de pesquisa, reutilização de códigos, dimensão prática <br> --- class: middle, center # Desafios da pesquisa com dados em webscraping <br> -- ## publicidade/acessibilidade <br> -- ## evocação versus coleta <br> -- ## representatividade <br> -- ## pré-construção algorítimica das informações <br> -- ## capacidade computacional <br> --- class: middle, center # Desafios da pesquisa com dados em webscraping <br> -- ## letramento digital dos pesquisadores <br> -- ## atentar para as escolhas no código <br> -- ## cuidado com o soterramento! (download *versus* capacidade analítica) <br> -- ## Não invisibilizar o método, nem "esconder" os dados --- class: inverse, center, middle # Provocações: <br> ##0 Um "erro no código" passa a constituir um "erro metodológico"? <img src="img/python.png" width="100%" style="display: block; margin: auto;" /> --- class: middle, center # "nossos ajudantes digitais já estão cheios de teoria e julgamento" (Bernhard Rieder and Theo Röhle in: BERRY, 2012, p. 70) <img src="img/bender.jpg" width="50%" style="display: block; margin: auto;" /> --- class: middle, center # “Não existe neutralidade metodológica das técnicas” (BOURDIEU; PASSERON; CHAMBOREDON, 2004, p. 55) <img src="img/bourdieu.jpg" width="45%" style="display: block; margin: auto;" /> --- class: middle, center ## Obrigado gente! .pull-left[ <img src="https://media.giphy.com/media/KzKHlzSlfHZV44EdTy/giphy.gif" width="100%" style="display: block; margin: auto;" /> ] .pull-right[ ##**Agradecimentos especiais**: ]