La pregunta hoy en día no es “¿tenemos datos”. A menudo, la primera pregunta es “¿tenemos los datos correctos?” Incluso si la respuesta a esta pregunta es “NO”, a menudo necesitamos ser capaces de hacer lo mejor que podamos para responder la pregunta “¿qué ideas podemos obtener de esta respuesta”?
La ciencia de datos moderna requiere un entorno de TI moderno. Sin embargo, también requiere un conocimiento actualizado de lo que es posible en la ciencia estadística. El campo de la ciencia estadística avanza tan rápidamente como cualquier otra ciencia. Muchos cursos de estadística se basan en técnicas que se inventaron antes de 1930, y la capacitación no se ha actualizado. Dada la disponibilidad de computadoras potentes, ya no se necesitan métodos analíticos convenientes para aproximar una solución. Podemos buscar la solución correcta, si permitimos un poco de tiempo en la computadora. Dado el precio del tiempo de computadora, esto rara vez parece ser una barrera para usar los mejores métodos disponibles.