在JobReady社区寻找职场答案

Find Authentic, Accurate and Professional Career Answers

  • 金昊

    会员
    2022年2月21日 21:41

    完整版代码最后一个cell好像是有问题的,data没有转成array格式,range也应该是(1,9)

  • 赖郦丽

    会员
    2022年4月27日 03:39

    有没有关于如何分析各分群的,不是很了解怎么分析用户行为

  • 苏弈桥

    会员
    2022年6月23日 00:03
    import matplotlib.pyplot as plt
    from sklearn.metrics import silhouette_score
    from sklearn.cluster import KMeans

    data=data.fillna(0)
    distortions = [] # 簇内误差平方和
    sil_score = [] # 轮廓系数
    for i in range(2, 50):
    kmeans_model = KMeans(n_clusters=i)
    predict_y = kmeans_model.fit_predict(data)

    distortions.append(kmeans_model.inertia_) # 簇内误差平方和
    sil_score.append(silhouette_score(data, predict_y)) # 轮廓系数
    print('簇内误差平方和:', distortions)
    print('轮廓系数:', sil_score)

    plt.plot(range(2, 50), distortions, marker='x')
    plt.xlabel('Number of clusters')
    plt.ylabel('Distortion')
    plt.title('distortions')
    plt.show()


    plt.plot(range(2, 50), sil_score, marker='x')
    plt.xlabel('Number of clusters')
    plt.ylabel('silhouette_score')
    plt.title('silhouette_score')
    plt.show()

    • 苏弈桥

      会员
      2022年6月23日 00:04

      最后的代码可以试试看这个

Start of Discussion
00 回复 2018 年 6 月
现在