Reduce memory requirements in KMedoids

KMedoids currently pre-computes a full distance matrix with `pairwise_distances` resulting in large memory usage making it unsuitable for datasets with more than 20-50k samples.

To improve the situation somewhat, following approaches could be possible,
 - [ ] use `pairwise_distances_chunked`
 - [ ] makes sure that for `float32` input the distance matrix is also 32 bit. 
 - [ ] investigate re-computing distance in each iterations (https://github.com/scikit-learn-contrib/scikit-learn-extra/pull/12#discussion_r307731034). This will reduce the memory requirements at the cost of additional compute time. I'm not sure it could be worth it.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Reduce memory requirements in KMedoids #23

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Reduce memory requirements in KMedoids #23

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions