Las fuentes de datos para Big Data son la materia prima para analizar la información y obtener resultados a vincular dentro de los Sistemas de Información Geográfica. Si la geolocalización es importante, la vinculación de los análisis de los permite obtener mapas estratégicos de gestión y mostrar lo que el ojo no ve.
Aunque las fuentes de datos para Big Data más ricos se encuentran en lugares aislados (como Facebook, Twitter y cualquier red social), disponemos de API para su extracción. Además existen infinidad de portales y fuentes de datos para Big Data desde los cuales obtener datos gratuitos de consulta y descarga para llevar a cabo nuestros análisis con Python, R, Hadoop, Apache o Mongo entre otros.
Ahí van algunos de mis lugares favoritos desde donde descargar materia prima interesante para el análisis de datos territoriales (ambientales y sociales principalmente) con Big Data y representarlos en nuestros mapas giseros.
- GitHub: la impresionante comunidad GitHub ofrece infinidad de datasets de diferente temática y distribución geográfica para compartir y descargar libremente.
- Amazon: desde donde descargar datos masivos vinculados a teledetección, clima, mailing, censos, música, libros o salud.
- Facebook: a través de su API Graph podremos dar salida a los datos de la red social del entorno de Facebook.
- Twitter: desde las API de Twitter también podremos realizar análisis y búsquedas de información dentro de la red social del pajarito.
- Google (datos de mercado): información actualizada de datos de mercado.
- Google Books Ngrams: información sobre textos analizados sobre colecciones de libros.
- Gapminder: cuenta con tablas tabuladas vinculadas a datos económicos, sociales y ambientales a nivel mundial.
- UNdata: probablemente una de las mayores bestias de datos estadísticos mundiales en la que infinidad de organismos vuelcan información. Una lanzadera a los principales portales estadísticos del mundo desde donde obtener datos sociales, ambientales, políticos, demográficos o sanitarios entre otros.
- Quandl: datos financieros con posibilidad de filtro por territorio y temática.
- Portal de datos abiertos de la Unión Europea: infinidad de datos vinculados a finanzas, sociedad, medio ambiente, industria, economía o empleo para la Unión Europea.
- World Bank Open Data: información repleta de indicadores sobre datos mundiales provenientes del Banco Mundial.
- Terrorismo: datos de localización de atentados terroristas desde 1979.
- Organización Mundial de la Salud: dispone de tablas y gráficas mundiales sobre aspectos sociales, sostenibilidad y salud.
- Cancer Today: mapas, datos y gráficas vinculadas a los estudios de cáncer mundial provenientes de la OMS.
- Wikimedia: copias de todas las wikis de wikimedia.
- DBpedia: bases de datos de análisis de los datos inmersos en Wikipedia.
- WorldClim: datasets de mapas vinculados a múltiples variables climáticas mundiales presentes, pasadas y futuras.
- GBIF: datos de distribución mundial de datos de biodiversidad de especies.
- NASA’s Open Data Portal: portal de datos abiertos de la NASA.
- EO-me: plataforma de búsqueda de metadatos de imágenes satélite de Landsat 8 y Sentinel 2 mediante filtros temáticos.
El mercado del Sistema de Información Geográfica (SIG) se valoró en USD 5,33 mil millones en 2016 y se espera que alcance los USD 10,12 mil millones en 2023, creciendo a una tasa compuesta anual del 9,6% entre 2017 y 2023.
Los principales actores involucrados en el mercado de software incluyen Autodesk, Inc. (EE. UU.), Bentley System, Incorporated (EE. UU.), Environmental Systems Research Institute, Inc. (Esri) (EE. UU.), General Electric Co. (EE. UU.), Hexagon AB (Suecia ), Pitney Bowes Inc. (EE. UU.), Topcon Corporation (Japón) y Trimble Inc. (EE. UU.).