The classificationlib's intro from hershyz

Complete ML toolset for classification-based prediction problems.

Install + Import:

Release v1.0 (download and unzip)

# importing all library modules:
import dataframe
import correlation_module
import sqrt_distance_classifier
import abs_distance_classifier
import percent_distance_classifier
import stddev_distance_classifier
import knn
import classnet

Initializing Dataframe + Correlating Input Features to Output Feature:

df = dataframe.Dataframe('test-data/drug200.csv')
correlation_module.run(df)

output:

highest correlation
---
Na_to_K
Cholesterol
BP
Sex
Age
---
lowest correlation

Example CSV Format (Drug200 Dataset)

Training + Predictions - Square Root Distance Classifier:

 # (dataframe, input features)
model = sqrt_distance_classifier.train(df, ['Na_to_K', 'Cholesterol', 'BP'])
 # (model, dataframe, output feature)
print(sqrt_distance_classifier.eval(model, df, 'Drug')) # get accuracy

output: 0.7

point = {
    'Age': 23,
    'Sex': 'F',
    'BP': 'HIGH',
    'Cholesterol': 'HIGH',
    'Na_to_K': 25.355
}
point_numerical = df.convert_point(point)
# (converted numerical point, model)
print(sqrt_distance_classifier.predict(point_numerical, model))

output: DrugY

Training + Predictions - Absolute Distance Classifier:

# (dataframe, input features)
model = abs_distance_classifier.train(df, ['Na_to_K', 'BP', 'Sex'])
# (model, dataframe, output feature)
print(abs_distance_classifier.eval(model, df, 'Drug')) # get accuracy

output: 0.7

point = {
    'Age': 23,
    'Sex': 'F',
    'BP': 'HIGH',
    'Cholesterol': 'HIGH',
    'Na_to_K': 25.355
}
point_numerical = df.convert_point(point)
# (converted numerical point, model)
print(abs_distance_classifier.predict(point_numerical, model))

output: DrugY

Training + Predictions - Percent Distance Classifier:

# (dataframe, input features)
model = percent_distance_classifier.train(df, ['Na_to_K', 'BP', 'Age'])
# (model, dataframe, output feature)
print(percent_distance_classifier.eval(model, df, 'Drug')) # get accuracy

output: 0.715

point = {
    'Age': 23,
    'Sex': 'F',
    'BP': 'HIGH',
    'Cholesterol': 'HIGH',
    'Na_to_K': 25.355
}
point_numerical = df.convert_point(point)
# (converted numerical point, model)
print(percent_distance_classifier.predict(point_numerical, model))

output: DrugY

Training + Predictions - Standard Deviation Distance Classifier:

# (dataframe, input features)
model = stddev_distance_classifier.train(df, ['Na_to_K', 'BP', 'Age'])
# (model, dataframe, output feature)
print(stddev_distance_classifier.eval(model, df, 'Drug')) # get accuracy

output: 0.705

point = {
    'Age': 23,
    'Sex': 'F',
    'BP': 'HIGH',
    'Cholesterol': 'HIGH',
    'Na_to_K': 25.355
}
point_numerical = df.convert_point(point)
# (converted numerical point, model)
print(stddev_distance_classifier.predict(point_numerical, model))

output: DrugY

Training + Predictions - ClassNet:

# (dataframe, input features)
model = classnet.train(df, ['Na_to_K', 'Cholesterol', 'Sex', 'BP', 'Age'])
# (model, dataframe, output feature)
print(classnet.eval(model, df, 'Drug')) # get accuracy

output: 0.24

point = {
    'Age': 23,
    'Sex': 'F',
    'BP': 'HIGH',
    'Cholesterol': 'HIGH',
    'Na_to_K': 25.355
}
point_numerical = df.convert_point(point)
# (converted numerical point, model)
print(classnet.predict(point_numerical, model))

output: DrugC

Training + Predictions - KNN:

df = dataframe.Dataframe('test-data/drug200.csv')
# (dataframe, input features, training dataset ratio)
model = knn.train(df, ['Na_to_K', 'Cholesterol', 'BP'], 'Drug', 0.5)
# (model, dataframe, output feature)
print(knn.eval(model, df, 'Drug'))

output: 0.88

point = {
    'Age': 23,
    'Sex': 'F',
    'BP': 'HIGH',
    'Cholesterol': 'HIGH',
    'Na_to_K': 25.355
}
point_numerical = df.convert_point(point)
# (converted numerical point, output feature, model)
print(knn.predict(point_numerical, 'Drug', model))

output: DrugY

hershyz / classificationlib Goto Github PK

classificationlib's Introduction

Install + Import:

Initializing Dataframe + Correlating Input Features to Output Feature:

Training + Predictions - Square Root Distance Classifier:

Training + Predictions - Absolute Distance Classifier:

Training + Predictions - Percent Distance Classifier:

Training + Predictions - Standard Deviation Distance Classifier:

Training + Predictions - ClassNet:

Training + Predictions - KNN:

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent