Cómo obtener datos históricos financieros de una o varias empresas y cómo generar gráficas para su análisis con Python. Obtenemos datos de precios de cotización de Google, Tesla y Facebook, usando Yahoo Finanzas (gratuito) y la librería de Python yfinance. Dibujamos gráficas comparativas entre estas empresas con Python y la librería matplotlib.
- Requisitos para obtener y analizar datos financieros con Python.
- Obtener ticker de una compañía/empresa/organización.
- Gráfica de evolución del precio de cotización de Google GOOG con Python, yfinance, pandas y matplotlib.
- Mostrar varios tickers en la gráfica, por ejemplo para Google, Tesla y Facebook.
Requisitos para obtener y analizar datos financieros con Python
Necesitaremos disponer de Python instalado en el equipo. En el siguiente artículo explicamos cómo instalarlo en Windows:
Usaremos un entorno de programación, por ejemplo Visual Studio Code, como el usado en el artículo anterior.
En sistemas Linux suele venir instalado Python.
Utilizaremos para este artículo algunas librerías adicionales de Python, una de ellas es yfinance, que podemos instalar desde la línea de comandos con:
pip install yfinance
Y para la extracción de datos online usaremos la librería pandas, en este artículo explicamos cómo instalarla en Python y cómo usarla:
Para dibujar las gráficas usaremos la librería matplotlib, que podemos instalar con:
pip install matplotlib
Obtener ticker de una compañía/empresa/organización
En primer lugar necesitaremos el nombre del ticker que requiere la librería yfinance. Cada compañía suele tener su identificativo (ticker). Por ejemplo, si accedemos a la URL:
Nos mostrará datos actuales de cotización de Google y también su nombre de ticker, en este caso GOOG:
Para el caso de Tesla será TSLA y para Facebook será FB. Estos serán los tikers de ejemplo que usaremos en este artículo.
Existen muchas otras librerías y orígenes de datos para obtener tickers de empresas, algunas son de pago. En nuestro caso hemos usado Yahoo finanzas, que es gratuita y válida para los ejemplos que realizaremos.
Gráfica de evolución del precio de cotización de Google GOOG con Python, yfinance, pandas y matplotlib
Abriremos el entorno de programación para Python, en nuestro caso Visual Studio Code, crearemos un nuevo fichero python con el nombre finanzas.py y agregaremos los imports de las librerías que vamos a usar:
1 2 3 |
import yfinance as yf import pandas as pd import matplotlib.pyplot as plt |
A continuación agregaremos el código para obtener los datos (online) del ticker indicado, como ejemplo de Google, con el ticker GOOG, e indicando la fecha desde la que queremos obtener los datos, por ejemplo, desde el 1 de enero de 2012 hasta la fecha actual:
1 2 3 4 |
#Obtenemos datos históricos de un ticket (por ejemplo GOOGL) precios = yf.download("GOOG", start="2012-01-01") #Convertimos a datetime object el resultado con pandas precios.index = pd.to_datetime(precios.index) |
Y mostramos los cinco primeros registros obtenidos para comprobar que todo funciona correctamente:
1 2 |
#Mostramos los cinco primeros registros del resultado para depurar print(precios.head(5)) |
Si compilamos la aplicación Python, nos debe mostrar los cinco primeros registros de cotización de Google desde el año 2012:
Una vez depurada y verificada la información obtenida, podremos dibujar una gráfica usando matplotlib, añadiendo el código Python:
1 2 3 4 5 6 7 8 9 10 |
#Dibujamos una gráfica con el resultado plt.figure(figsize=(10,7)) #Ajustamos a dividendos y splits precios['Adj Close'].plot() #Configurarmos la gráfica plt.title('Precios de Google (últimos 10 años)', fontsize=14) plt.xlabel('Año-Mes', fontsize=12) plt.ylabel('Precio', fontsize=12) #Mostramos la gráfica plt.show() |
Si compilamos ahora nuestra aplicación nos mostrará el gráfico con los datos obtenidos, en el eje X el año y en el Y el precio de cotización:
El código Python completo del ejemplo anterior:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
import yfinance as yf import pandas as pd import matplotlib.pyplot as plt #Obtenemos datos históricos de un ticket (por ejemplo GOOGL) precios = yf.download("GOOG", start="2012-01-01") #Convertimos a datetime object el resultado con pandas precios.index = pd.to_datetime(precios.index) #Mostramos los cinco primeros registros del resultado para depurar #print(precios.head(5)) #Dibujamos una gráfica con el resultado plt.figure(figsize=(10,7)) #Ajustamos a dividendos y splits precios['Adj Close'].plot() #Configurarmos la gráfica plt.title('Precios de Google (últimos 10 años)', fontsize=14) plt.xlabel('Año-Mes', fontsize=12) plt.ylabel('Precio', fontsize=12) #Mostramos la gráfica plt.show() |
Mostrar varios tickers en la gráfica, por ejemplo para Google, Tesla y Facebook
Para mostrar varios tickers en una misma gráfica y así poder comparar entre empresas, usaremos el mismo código anterior (o parecido), añadiendo una lista de tickers en lugar de uno sólo, el código Python será:
1 2 3 4 5 6 7 8 9 10 11 12 13 |
import yfinance as yf import pandas as pd import matplotlib.pyplot as plt #Creamos una lista con los tickers a descargar lista_precios = ['TSLA', 'GOOG', 'FB'] #Descargamos todos los tickers de la lista y sólo los datos que necesitamos precios = yf.download(lista_precios, start="2012-01-01")['Adj Close'] #Convertimos a datetime object el resultado con pandas precios.index = pd.to_datetime(precios.index) #Mostramos los cinco primeros registros del resultado para depurar print(precios.head(5)) |
Si compilamos obtendremos un dataframe con los datos de las tres empresas:
Ahora dibujamos la gráfica para mostrar visualmente la diferencia y evolución de cada una de ellas, el código completo Python:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
import yfinance as yf import pandas as pd import matplotlib.pyplot as plt #Creamos una lista con los tickers a descargar lista_precios = ['TSLA', 'GOOG', 'FB'] #Descargamos todos los tickers de la lista y sólo los datos que necesitamos precios = yf.download(lista_precios, start="2012-01-01")['Adj Close'] #Convertimos a datetime object el resultado con pandas precios.index = pd.to_datetime(precios.index) #Mostramos los cinco primeros registros del resultado para depurar #print(precios.head(5)) #Dibujamos una gráfica con el resultado plt.figure(figsize=(10,7)) #Preparamos cada ticker precios['FB'].plot() precios['GOOG'].plot() precios['TSLA'].plot() #Configurarmos la gráfica plt.title('Precios Facebook Google Tesla', fontsize=14) plt.xlabel('Año-Mes', fontsize=12) plt.ylabel('Precio', fontsize=12) #Mostramos la leyenda para saber qué color corresponde a cada empresa plt.legend() #Mostramos la gráfica plt.show() |
Si compilamos la aplicación Python, obtendremos una gráfica con tres líneas (una por cada empresa), con su evolución y comparativa visual, también mostramos la leyenda para saber qué color corresponde a cada empresa:
En la gráfica anterior cada empresa tiene su magnitud de valores de datos, su naturaleza, por ello, vemos que hay una de las líneas que se «dispara». Para solucionar esto, usaremos valores absolutos en función de su valor inicial:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 |
import yfinance as yf import pandas as pd import matplotlib.pyplot as plt #Creamos una lista con los tickers a descargar lista_precios = ['TSLA', 'GOOG', 'FB'] #Descargamos todos los tickers de la lista y sólo los datos que necesitamos precios = yf.download(lista_precios, start="2012-01-01")['Adj Close'] #Convertimos a datetime object el resultado con pandas precios.index = pd.to_datetime(precios.index) #Mostramos los cinco primeros registros del resultado para depurar #print(precios.head(5)) #Dibujamos una gráfica con el resultado plt.figure(figsize=(10,7)) #Graficamos la evolución respecto al inicio con cada ticker (precios['FB']/precios['FB'].iloc[0]).plot() (precios['GOOG']/precios['GOOG'].iloc[0]).plot() (precios['TSLA']/precios['TSLA'].iloc[0]).plot() #Configurarmos la gráfica plt.title('Precios Facebook Google Tesla', fontsize=14) plt.xlabel('Año-Mes', fontsize=12) plt.ylabel('Precio', fontsize=12) #Mostramos la leyenda para saber qué color corresponde a cada empresa plt.legend() #Mostramos la gráfica plt.show() |
Ahora al compilar y analizar el resultado, los valores sí que están en su misma magnitud, aunque vemos que la serie de Facebook no aparece:
Esto es debido a que en la fecha de inicio (enero de 2012) tal vez no había datos para Facebook, y al dividir por ese primer valor inexistente el resto de la serie nos dará nula. Para solucionarlo ampliaremos la fecha de inicio, por ejemplo a 2014 y ahora sí que obtendremos la gráfica comparativa correcta: