Fontes de dados
Toda camada de GAIA é construída sobre fontes públicas, oficiais e auditáveis. Esta página lista cada fonte, seu status de ingestão na plataforma, a referência cruzada com outras instituições, e os números atuais. Quando há divergência entre fontes — e há — explicamos por quê.
Status atual
| Camada | Fonte primária | Fonte de cross-check | Total na plataforma | Status |
|---|---|---|---|---|
| Unidades de Conservação |
CNUC / MMA Cadastro Nacional, snapshot 2024.02 |
ICMBio (UCs federais) Painel ISA (curadoria social) |
2.741 UCs ativas | Oficial |
| Terras Indígenas |
GeoServer FUNAI Camada `tis_poligonais` — ref. 2023-09-05 |
ISA — Terras Indígenas no Brasil FUNAI — Geoprocessamento |
655 TIs com polígono | Oficial |
| Territórios Quilombolas (polígonos titulados/em processo) | INCRA Sigef (nacional, exportação 2026-05-04) | CONAQ (movimento social) | 427 (16+ UF) | Oficial |
| Quilombolas certificadas (Palmares) | Fundação Cultural Palmares — CRQs (cross-check com INCRA Sigef) |
CONAQ ISA — Comunidades Quilombolas |
769 pins (de 2.708 CRQs; 270 já em INCRA, 1.662 sem coord) |
Parcial |
| Assentamentos da reforma agrária | INCRA / Sigef (atrás de login gov.br) | MST (sem geodados públicos consolidados) | — | Bloqueado por auth |
| Bacias hidrográficas | ANA — Ottobacias | IBGE — Hidrografia | — | Sprint 7 |
| Nascentes | ANA + dados primários colaborativos |
Custodiantes locais (associações comunitárias, proprietários) Camada com tier Agregado por padrão — ver política |
— | Sprint 9 |
| Cobertura e uso da terra | MapBiomas | — | — | Sprint 7 |
| Alertas de desmatamento | Global Forest Watch (GLAD/RADD) | INPE — TerraBrasilis | — | Sprint 7 |
| Espécies ameaçadas |
IUCN Red List Spatial Data (polígonos oficiais) IUCN Red List API v4 (categoria, ameaças, citação) GBIF (concave hull para espécies sem range oficial ainda) |
SALVE/ICMBio (Cloudflare bloqueia bots) BirdLife Data Zone (aves — registro separado pendente) |
25 espécies-bandeira 11 polígonos oficiais IUCN · 14 concave hull GBIF |
Oficial (misto) |
| Pesquisa acadêmica | Repositórios institucionais via OAI-PMH |
UFSB, UFSCar, USP, UFV, UnB, UEFS, UFBA, UFPA Plataforma Sucupira/CAPES para validação de autoria |
— | Sprint 9 |
Por que os números diferem entre fontes
Você vai encontrar na imprensa números diferentes para a mesma coisa. Isso é normal e pode ter várias razões legítimas. Documentamos abaixo as divergências que conhecemos para que ninguém se assuste.
Unidades de Conservação — por que 2.741?
O CNUC 2024.02 traz 2.741 UCs ativas. Outras citações comuns:
- 335 UCs federais (ICMBio) — refere-se apenas às UCs sob gestão direta do ICMBio. O CNUC traz 989 federais porque inclui as RPPNs federais (privadas, mas reconhecidas pelo governo federal — 653 unidades). 989 − 653 = 336, valor próximo aos 335 reportados pelo ICMBio.
- 2.201 UCs (Wikipedia / SNUC 2025) — snapshot anterior ao do nosso dataset. O CNUC é atualizado continuamente.
- Painel ISA — pode aplicar filtros próprios (excluir RPPN, agrupar por bioma, etc).
Nosso valor (2.741) reflete exatamente o que está no CNUC oficial em 2024.02. As 1.106 RPPNs no nosso dataset são reservas privadas com registro oficial — terras protegidas legítimas, mas pequenas e dispersas.
Terras Indígenas — por que 655 e não 764?
A FUNAI registra atualmente 764 terras indígenas em diferentes fases administrativas. O nosso dataset traz 655 porque consumimos especificamente a camada tis_poligonais do GeoServer da FUNAI — apenas TIs com polígono delimitado.
- TIs em fase Em estudo normalmente ainda não têm polígono — aparecem em outra camada (
tis_pontos) que não ingerimos no MVP. - O ISA cita 728 TIs com critérios próprios; o número varia conforme fonte e data.
Resumo dos estágios das 655 TIs do GAIA:
- 494 Regularizadas — etapa final do processo demarcatório
- 17 Homologadas — penúltima etapa, falta apenas registro
- 73 Declaradas
- 41 Delimitadas
- 24 Encaminhadas RI (reserva indígena)
- 6 Em Estudo com polígono provisório
Compromisso de transparência: sempre que uma camada do GAIA tiver número diferente de uma fonte oficial alternativa, vamos documentar a divergência aqui. Se você encontrar uma divergência que não está listada, abra um issue no GitHub: github.com/institutomuvuka/gaia/issues.
Como reproduzir as ingestões
Todos os pipelines são scripts Python reproduzíveis no diretório /scripts do repositório:
scripts/ingest_cnuc.py— baixa o shapefile oficial do MMA, simplifica a geometria e geradata/conservation-units.geojsonscripts/ingest_funai_tis.py— consome o WFS oficial da FUNAI e geradata/indigenous-lands.geojson