KMeans Clustering#

this notebook made with help from Sam Fielding

A proof of concept of applying clustering analysis to the data…

Environment setup#

import os
import datetime as dt
import pandas as pd
import numpy as np
import xarray as xr
import dask as da
from dask.diagnostics import ProgressBar
import zarr
# import holoviews as hv
# import hvplot.xarray
import matplotlib.pyplot as plt
from tqdm.auto import tqdm
from sklearn.cluster import KMeans

from src.env import ICOS_FILE

TMPDIR = os.getcwd()
zarr_store = os.path.join(TMPDIR, "datacube_test.zarr")
print("Using:", zarr_store)

xr.set_options(
    display_expand_attrs=False,
    display_expand_data_vars=True
);

Using: /home/ash/code/geomagnetic_datacubes_dev/notebooks/datacube_test.zarr

Geomagnetic datacubes development

KMeans Clustering

Contents

KMeans Clustering#

Environment setup#

Initialise data to use#

Extract data to input to KMeans#

Apply KMeans algorithm#