用户分群

用户分群

https://www.nowcoder.com/practice/ba24c14adb424bd2b4888c70ddfe9568

用户分群

题目分析

电商平台需要根据用户的购物行为(月均消费金额、月均访问次数、退货率三个维度)对用户进行聚类分群。给定 个初始聚类中心和指定迭代次数,实现标准 KMeans 算法,输出最终的聚类中心坐标,保留两位小数。

思路

KMeans 算法模拟

这道题不需要任何花哨的优化,就是忠实模拟 KMeans 的两个核心步骤,反复执行指定次数即可。

每轮迭代分两步:

  1. 分配阶段:对每个数据点,计算它到所有 个聚类中心的欧氏距离(比较距离时用距离平方即可,省去开根号),将其归入距离最近的聚类
  2. 更新阶段:对每个聚类,将中心更新为该聚类内所有点各维度的算术平均值。若某聚类没有点被分配到,中心保持不变

注意欧氏距离公式为 ,但由于只需要比较大小,计算时省略 不影响结果。

以样例 1 验证,初始中心 ,6 个数据点,迭代 2 次。

  • 第 1 轮: 距第一个中心更近,归入第一组;另外三个点归入第二组
  • 更新中心为
  • 第 2 轮:分配结果不变,中心不变,输出即为答案

复杂度

  • 时间复杂度:,其中 为特征维度
  • 空间复杂度:

代码

import sys

def main():
    data = sys.stdin.read().split()
    idx = 0
    K = int(data[idx]); idx += 1
    centers = []
    for i in range(K):
        c = [float(data[idx]), float(data[idx+1]), float(data[idx+2])]
        idx += 3
        centers.append(c)
    iters = int(data[idx]); idx += 1
    m = int(data[idx]); idx += 1
    points = []
    for i in range(m):
        p = [float(data[idx]), float(data[idx+1]), float(data[idx+2])]
        idx += 3
        points.append(p)

    for _ in range(iters):
        clusters = [[] for _ in range(K)]
        for p in points:
            best = -1
            best_dist = float('inf')
            for j in range(K):
                d = sum((p[d2] - centers[j][d2]) ** 2 for d2 in range(3))
                if d < best_dist:
                    best_dist = d
                    best = j
            clusters[best].append(p)

        for j in range(K):
            if clusters[j]:
                n = len(clusters[j])
                centers[j] = [sum(p[d2] for p in clusters[j]) / n for d2 in range(3)]

    for c in centers:
        print(f"{c[0]:.2f} {c[1]:.2f} {c[2]:.2f}")

main()
全部评论

相关推荐

压力很大,面试官全程高压,问的问题不难,但是没有任何反馈,很慌张,也无算法。实习问了20分钟,一直问我你们做的有什么用,总时长一小时1.学校都有什么课程2.spring的ioc原理以及优点3.除了解耦还知道什么?4.springboot与spring区别,二者的源码看过没?Tomcat了解嘛?有没有具体看过5.spring的bean,面试官一直在重复一个思想问我懂不懂,完全没听过6.mybatis是干什么的?ibatis用过没?平常怎么写SQL?完全不写嘛?7.设计一个分布式双十一秒杀系统(前端,网关,缓存,数据库防超卖全设计)8.怎么做限流9.缓存与数据库一致性,你做异步要用户等你嘛?10.负载均衡怎么做11.多数据中心还是单数据中心,如果出现没卖完怎么做(到这完全不会了,面试官直接说换个话题吧)12.平常读书吗?13.上过哲学课嘛?14.兴趣爱好有没有15.对ai的看法16.来深圳有问题嘛?17.为什么不考研18.上大学带给了你什么?你提升在哪里,有没有具体的例子?反问:1.现在手机都有应用市场,应用宝怎么盈利?除了手机应用市场还是有人用,现在在做跨端,微软都有合作,之后会进军mac,主要做游戏,腾讯本身就是游戏大户。2.面试表现?整体评价一下会给到反馈。面完直接变HR面,今天HR面后,已经转为录用评估了,来牛客许个愿,暑期现在还没什么面试,希望能拿个offer之后再考虑要不要留在手子吧。
nunuking:三面压力这么大吗,面试的会议约了多长时间呀
面试问题记录
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务