Fluxo de trabalho N8N para gerar arquivos CSV usando GPT-4

Prepare CSV files with GPT-4

Fluxo de trabalho automatizado que gera dados fictícios de usuários por meio do OpenAI GPT-4 e exporta em lote para arquivos CSV

11 NodesAI & MLgeração de dados com IA exportação CSV testes automatizados

Visão Geral do Fluxo de Trabalho

Este é um fluxo de trabalho automatizado no n8n que utiliza o GPT-4 para gerar dados fictícios de usuários e exportá-los como arquivos CSV. O fluxo chama a API da OpenAI para criar informações fictícias de usuários, processa esses dados e os salva como múltiplos arquivos CSV no disco local.

Detalhamento do Fluxo de Trabalho

1. Fase de Disparo

  • : When clicking "Execute Workflow" (gatilho manual)
  • Função: Inicia a execução do fluxo inteiro ao clicar manualmente
  • Posição: Nó inicial do fluxo de trabalho

2. Fase de Geração de Dados

  • : OpenAI
  • Tipo: n8n-nodes-base.openAi
  • Configuração:
    • Modelo utilizado: GPT-4
    • Número de chamadas: 3
    • Máximo de tokens: 2500
    • Temperatura: 1 (aumenta a aleatoriedade)
  • Prompt: Solicita ao GPT-4 que gere um array JSON com 10 usuários aleatórios, contendo os seguintes campos:
    • user_name: Nome fictício (nome e sobrenome começam com a mesma letra)
    • user_email: Endereço de e-mail
    • subscribed: Status de inscrição (valor booleano)
    • date_subscribed: Data de inscrição (uma data aleatória anterior a 2023-10-01, caso esteja inscrito)

3. Fase de Processamento em Lotes

  • : Split In Batches
  • Função: Divide as 3 respostas da OpenAI em lotes, processando uma por vez
  • Tamanho do lote: 1
  • Propósito: Garantir que cada lista de usuários gerada seja processada separadamente e salva como um arquivo CSV independente

4. Fase de Análise dos Dados

  • : Parse JSON
  • Tipo: Nó Set
  • Função: Converte a string JSON retornada pela OpenAI em um objeto JSON real
  • Operação: Extrai o campo message.content e o analisa como um array

5. Fase de Expansão dos Dados

  • : Make JSON Table
  • Tipo: Nó Item Lists
  • Função: Transforma cada objeto de usuário no array JSON em um item de dados independente
  • Campo: Expande o campo "content"

6. Fase de Conversão para CSV

  • : Convert to CSV
  • Tipo: Nó Spreadsheet File
  • Configuração:
    • Formato de saída: CSV
    • Nome do arquivo: funny_names_[número].csv (número inicia em 1)
    • Incluir cabeçalho: Sim

7. Fase de Limpeza dos Dados

7.1 Remoção dos bytes BOM

  • : Strip UTF BOM bytes
  • Tipo: Nó Move Binary Data
  • Função: Remove os bytes BOM (Byte Order Mark) do UTF-8
  • Importância: Evita problemas de codificação ao ler arquivos CSV

7.2 Criação de binário válido

  • : Create valid binary
  • Tipo: Nó Move Binary Data
  • Configuração:
    • Modo: Conversão de JSON para binário
    • Codificação: UTF-8
    • Tipo MIME: text/csv
    • Não adicionar BOM
  • Função: Converte os dados processados em um arquivo binário no formato correto

8. Fase de Salvamento do Arquivo

  • : Save to Disk
  • Tipo: Nó Write Binary File
  • Caminho: ./.n8n/funny_names_[número].csv
  • Função: Salva o arquivo CSV gerado no diretório de trabalho do n8n
  • Loop: Após salvar, retorna ao nó Split In Batches para processar o próximo lote

Características do Fluxo de Trabalho

Vantagens

  1. Alto grau de automação: Gera múltiplos arquivos CSV com dados aleatórios com apenas um clique
  2. Formato padronizado dos dados: Estrutura clara e compatível com cenários reais de negócios
  3. Capacidade de processamento em lote: Permite gerar simultaneamente vários conjuntos distintos de dados
  4. Tratamento adequado de codificação: Resolve especificamente o problema dos bytes BOM, garantindo compatibilidade dos arquivos

Casos de Uso

  • Geração de dados de teste
  • Preenchimento de ambientes de desenvolvimento
  • Demonstrações e treinamentos
  • Teste de fluxos de processamento de arquivos CSV

Dados Fixos

O fluxo inclui 3 conjuntos de dados de teste pré-gerados (pinData), cada um contendo 10 registros de usuários. Esses dados já estão fixados no nó OpenAI, facilitando testes e demonstrações sem precisar chamar a API repetidamente.

Observações Importantes

  1. É necessário configurar credenciais válidas da API da OpenAI
  2. Certifique-se de que o diretório .n8n exista e tenha permissões de gravação
  3. O tratamento dos bytes BOM é essencial para leitura correta dos arquivos CSV em diferentes plataformas
  4. Os dados gerados são fictícios e destinam-se exclusivamente a testes