Carregando conteúdo…
Rolf Rostock
@admin_inrbybx8 · 14 de outubro de 2024
Como Funciona o ChatGPT

Entenda o Processo de Treinamento e Resposta.

Para treinar um modelo ChatGPT, existem duas etapas principais:

Pré-treinamento

Nesta etapa, treinamos um modelo GPT (um transformador de decodificação) com uma grande quantidade de dados da internet. O objetivo é treinar um modelo capaz de prever as próximas palavras em uma frase de forma gramaticalmente correta e semanticamente coerente, baseado em grandes volumes de dados da internet. Neste estágio, o treinamento é feito de forma não supervisionada, o que significa que o modelo aprende padrões linguísticos sem um objetivo específico, como responder a perguntas.

Ajuste fino

Esta etapa transforma o modelo pré-treinado em um modelo de perguntas e respostas como o ChatGPT, por meio de um processo de 3 passos:

  • Coletar dados de treinamento (perguntas e respostas) e ajustar o modelo pré-treinado com esses dados. O modelo aprende a gerar respostas semelhantes aos exemplos fornecidos por seres humanos.
  • Coletar mais dados (perguntas e várias respostas) e treinar um modelo de recompensa, que atribui pontuações às respostas, classificando-as da mais relevante para a menos relevante, com base em feedback humano.
  • Usar aprendizado por reforço (otimização PPO) para refinar o modelo, tornando as respostas mais precisas e alinhadas às expectativas. O modelo é ajustado com base nas recompensas recebidas para melhorar sua precisão.

Responder a um prompt

Passo 1: O usuário digita uma pergunta completa, como “Explique como funciona um algoritmo de classificação”.
Passo 2: A pergunta é enviada para um componente de moderação de conteúdo, que garante que a pergunta não viole diretrizes de segurança e filtra perguntas inadequadas.
Passos 3-4: Se a entrada passar pela moderação, ela é enviada ao modelo ChatGPT para processamento. Caso contrário, a entrada vai diretamente para a geração de respostas genéricas e seguras.
Passos 5-6: Depois que o modelo gera a resposta, ela passa novamente pelo componente de moderação de conteúdo para garantir que seja segura, imparcial e apropriada.
Passo 7: Se a resposta passar pela moderação, ela é exibida ao usuário. Caso contrário, uma resposta padrão e segura é mostrada.
Rolf Rostock
@admin_inrbybx8 · 13 de outubro de 2024
Principais Bibliotecas Python
Raspagem de Dados
  • requests: Obtém o conteúdo de páginas web.
  • Beautiful Soup 4: Faz o parsing de HTML.
  • lxml: Outro analisador HTML.
  • Selenium: Controla um navegador.
  • Scrapy: Framework para raspagem de dados.
  • urllib: Manipulação de URLs.
  • pandas: Organiza dados.
Aprendizado de Máquina
  • scikit-learn: Algoritmos gerais de ML.
  • TensorFlow: Framework de aprendizado profundo.
  • Keras: Redes neurais de alto nível.
  • PyTorch: Outro framework de aprendizado profundo.
  • NumPy: Operações com arrays e matemáticas.
  • pandas: Manipulação e análise de dados.
  • matplotlib: Visualização de dados.
  • Seaborn: Visualização estatística de dados.
Visualização de Dados
  • matplotlib: Biblioteca geral de gráficos.
  • Seaborn: Visualização estatística.
  • Plotly: Gráficos interativos baseados na web.
  • Bokeh: Visualizações interativas para a web.
  • Altair: Visualizações declarativas.
  • ggplot: Implementação de gramática de gráficos.
  • HoloViews: Exploração de dados de alto nível.
Manipulação de Dados
  • pandas: Principal módulo de manipulação de dados.
  • NumPy: Arrays e matrizes, operações numéricas.
  • SciPy: Computação científica, funções avançadas.
  • Dask: Computação paralela, grandes conjuntos de dados.
  • Vaex: DataFrames fora do núcleo, eficiente em memória.
  • Petl: Operações ETL (Extração, Transformação, Carregamento).
Processamento de Linguagem Natural (NLP)
  • NLTK: Ferramentas fundamentais de NLP.
  • spaCy: NLP rápido e eficiente.
  • Gensim: Modelagem de tópicos e embeddings de palavras.
  • TextBlob: Tarefas simplificadas de NLP.
  • Stanford CoreNLP: NLP avançado da Stanford.
  • transformers: Modelos de NLP de última geração.
  • polyglot: NLP multilíngue.
Análise Estatística
  • Statsmodels: Modelos e testes estatísticos.
  • SciPy: Biblioteca científica central.
  • PyMC3: Programação probabilística.
  • Lifelines: Análise de sobrevivência.
  • Pingouin: Testes estatísticos e gráficos.
  • PyStan: Inferência bayesiana.
Rolf Rostock
@admin_inrbybx8 · 19 de setembro de 2024
Bitbucket: Novos Patches de Segurança e Melhorias em Automação DevOps

a Atlassian anunciou a liberação de patches para corrigir várias vulnerabilidades de alta gravidade em quatro de seus produtos: Bamboo, Bitbucket, Confluence e Crowd. Esses bugs permitiam que invasores explorassem falhas para criar condições de negação de serviço (DoS), conforme detalhado no boletim de segurança de setembro de 2024 da Atlassian.

No caso do Bamboo, o problema corrigido estava relacionado ao CVE-2024-34750, um defeito no Coyote, componente conector do Apache Tomcat. Essa falha ocorria durante o processamento de fluxos HTTP/2 com cabeçalhos excessivos, o que resultava na contagem incorreta de fluxos ativos e, consequentemente, na manutenção de conexões que deveriam ter sido fechadas. O problema poderia ser explorado por atacantes não autenticados para expor ativos vulneráveis.

Já no Bitbucket, além da falha no Tomcat Coyote, foi corrigido o CVE-2024-32007, um erro de validação de entrada no código Apache CXF JOSE, que poderia permitir a execução de um ataque DoS especificando um valor excessivamente grande no parâmetro p2c de um token.

No Confluence, foram resolvidas duas vulnerabilidades, uma relacionada à dependência Java Bouncy Castle (CVE-2024-29857) e outra no Clojure (CVE-2024-22871). O Crowd também teve uma atualização para corrigir a falha Bouncy Castle Java.

A Atlassian informou que todas essas vulnerabilidades foram relatadas através de seu programa de recompensas por bugs e reforçou que, até o momento, nenhuma dessas falhas foi explorada ativamente. A empresa recomenda que os usuários atualizem suas instalações para as versões mais recentes ou corrigidas o mais rápido possível.

Fonte:
http://www.securityweek.com/atlassian-patches-vulnerabilities-in-bamboo-bitbucket-confluence-crowd/