Rolf Rostock
@admin_inrbybx8 · 13 de outubro de 2024 17:27
@admin_inrbybx8 · 13 de outubro de 2024 17:27
Raspagem de Dados
- requests: Obtém o conteúdo de páginas web.
- Beautiful Soup 4: Faz o parsing de HTML.
- lxml: Outro analisador HTML.
- Selenium: Controla um navegador.
- Scrapy: Framework para raspagem de dados.
- urllib: Manipulação de URLs.
- pandas: Organiza dados.
Aprendizado de Máquina
- scikit-learn: Algoritmos gerais de ML.
- TensorFlow: Framework de aprendizado profundo.
- Keras: Redes neurais de alto nível.
- PyTorch: Outro framework de aprendizado profundo.
- NumPy: Operações com arrays e matemáticas.
- pandas: Manipulação e análise de dados.
- matplotlib: Visualização de dados.
- Seaborn: Visualização estatística de dados.
Visualização de Dados
- matplotlib: Biblioteca geral de gráficos.
- Seaborn: Visualização estatística.
- Plotly: Gráficos interativos baseados na web.
- Bokeh: Visualizações interativas para a web.
- Altair: Visualizações declarativas.
- ggplot: Implementação de gramática de gráficos.
- HoloViews: Exploração de dados de alto nível.
Manipulação de Dados
- pandas: Principal módulo de manipulação de dados.
- NumPy: Arrays e matrizes, operações numéricas.
- SciPy: Computação científica, funções avançadas.
- Dask: Computação paralela, grandes conjuntos de dados.
- Vaex: DataFrames fora do núcleo, eficiente em memória.
- Petl: Operações ETL (Extração, Transformação, Carregamento).
Processamento de Linguagem Natural (NLP)
- NLTK: Ferramentas fundamentais de NLP.
- spaCy: NLP rápido e eficiente.
- Gensim: Modelagem de tópicos e embeddings de palavras.
- TextBlob: Tarefas simplificadas de NLP.
- Stanford CoreNLP: NLP avançado da Stanford.
- transformers: Modelos de NLP de última geração.
- polyglot: NLP multilíngue.
Análise Estatística
- Statsmodels: Modelos e testes estatísticos.
- SciPy: Biblioteca científica central.
- PyMC3: Programação probabilística.
- Lifelines: Análise de sobrevivência.
- Pingouin: Testes estatísticos e gráficos.
- PyStan: Inferência bayesiana.