Principais Bibliotecas Python
Raspagem de Dados
  • requests: Obtém o conteúdo de páginas web.
  • Beautiful Soup 4: Faz o parsing de HTML.
  • lxml: Outro analisador HTML.
  • Selenium: Controla um navegador.
  • Scrapy: Framework para raspagem de dados.
  • urllib: Manipulação de URLs.
  • pandas: Organiza dados.
Aprendizado de Máquina
  • scikit-learn: Algoritmos gerais de ML.
  • TensorFlow: Framework de aprendizado profundo.
  • Keras: Redes neurais de alto nível.
  • PyTorch: Outro framework de aprendizado profundo.
  • NumPy: Operações com arrays e matemáticas.
  • pandas: Manipulação e análise de dados.
  • matplotlib: Visualização de dados.
  • Seaborn: Visualização estatística de dados.
Visualização de Dados
  • matplotlib: Biblioteca geral de gráficos.
  • Seaborn: Visualização estatística.
  • Plotly: Gráficos interativos baseados na web.
  • Bokeh: Visualizações interativas para a web.
  • Altair: Visualizações declarativas.
  • ggplot: Implementação de gramática de gráficos.
  • HoloViews: Exploração de dados de alto nível.
Manipulação de Dados
  • pandas: Principal módulo de manipulação de dados.
  • NumPy: Arrays e matrizes, operações numéricas.
  • SciPy: Computação científica, funções avançadas.
  • Dask: Computação paralela, grandes conjuntos de dados.
  • Vaex: DataFrames fora do núcleo, eficiente em memória.
  • Petl: Operações ETL (Extração, Transformação, Carregamento).
Processamento de Linguagem Natural (NLP)
  • NLTK: Ferramentas fundamentais de NLP.
  • spaCy: NLP rápido e eficiente.
  • Gensim: Modelagem de tópicos e embeddings de palavras.
  • TextBlob: Tarefas simplificadas de NLP.
  • Stanford CoreNLP: NLP avançado da Stanford.
  • transformers: Modelos de NLP de última geração.
  • polyglot: NLP multilíngue.
Análise Estatística
  • Statsmodels: Modelos e testes estatísticos.
  • SciPy: Biblioteca científica central.
  • PyMC3: Programação probabilística.
  • Lifelines: Análise de sobrevivência.
  • Pingouin: Testes estatísticos e gráficos.
  • PyStan: Inferência bayesiana.