Vaga Back-End

Engenheiro(a) de Dados

API Cloud DevOps Pandas Python SQL

Pareto

Pareto

Pequena/média empresa

Localização: Rio de Janeiro (Presencial)

Salário: Não especificado

Aceito candidatos de outras cidades/estados dispostos a se mudar para o local de trabalho

Descrição da empresa

Fundada em 2013, a Pareto é uma empresa de tecnologia focada em implementação de projetos de IA.

São mais de 300 clientes ativos, como Universal Music, Reserva, Grupo Salta, Nivea, RE/MAX, Hering, Saint-Gobain e diversos outros.

Meta Partner e Premier Google Partner desde 2016. Já somamos 16 premiações pela Endeavor e Google Awards que acontecem todos os anos em Nova York. Em 2022, fomos a empresa mais premiada do mundo pelo Google, reconhecimento pela excelência na implementação de inovação e IA na área de marketing.

Em 2023, criamos a Tess AI, plataforma de IA que alcançou 2 milhões de usuários e foi eleita a #6 melhor do mundo pelo G2.

Atividades e Responsabilidades

Modelo de Trabalho
- Contratação: PJ
- Duração: 6 meses (projeto temporário com possibilidade de extensão)
- Localização: Presencial (Barra da Tijuca - Rio de Janeiro)
- Regime: Full-time dedicado ao projeto

Buscamos um Engenheiro de Dados Sênior para atuar no projeto de IA e Automação. Você será o especialista em engenharia e análise de dados.

Como arquiteto técnico do projeto, será responsável pelas integrações e preparação de base de dados relacionadas às automações, além de desenvolver modelos de análise que identificarão oportunidades de otimização de processos.

Sua missão será garantir escalabilidade, segurança e performance das soluções, construindo pipelines de dados robustos, integrando APIs, orquestrando containers e estabelecendo práticas de MLOps.

Requisitos

Hard Skills

- Conhecimento em machine learning, modelos matemáticos e estatísticos
- Domínio avançado de Python e bibliotecas (Pandas, NumPy, Scikit-learn)
- Experiência hands-on com Cloud (AWS, Azure ou GCP): EC2, S3, Lambda, RDS
- Expertise em DevOps/Infraestrutura: Docker, Kubernetes, CI/CD (Jenkins, GitLab CI, GitHub Actions)
- Conhecimento em bancos de dados relacionais (PostgreSQL, MySQL) e NoSQL (MongoDB, Redis)
- Experiência com ETL/ELT e construção de data pipelines (Airflow, Prefect ou similares)
- Arquitetura de soluções escaláveis e seguras
- Git avançado e boas práticas de versionamento
- Experiência com APIs REST e integrações de sistemas
- Monitoramento e observabilidade (Prometheus, Grafana, ELK Stack)

Diferenciais Competitivos

- Experiência no setor farmacêutico, logística ou varejo
- Experiência com MLOps e deploy de modelos em produção
- Conhecimento em Terraform, Ansible ou outras ferramentas de IaC (Infrastructure as Code)
- Vivência com Big Data: Spark, Hadoop, Databricks
- Experiência com ferramentas de RPA (UiPath, Automation Anywhere, Power Automate)
- Conhecimento em Vector Databases (Pinecone, Weaviate, Qdrant)
- Experiência com LLMs e frameworks de IA (LangChain, LlamaIndex)
- Certificações Cloud (AWS Solutions Architect, Azure Data Engineer, GCP Professional)
- Conhecimento em processamento de documentos (OCR, NLP)