数据处理,在散点图上找数据集中区域
在散点图上想要找到点分布比较密集的区域。
如图所示,希望找到分布密集的区域对应的横坐标的区间,同时可以设定一个阈值:多少算是密集的。可能有多个密集区域,希望都能找出来。
不知道用什么软件或者统计学方法可以做到。
希望大家指点一二
非常感谢

6C14311ECFF93C6AD3819D66EA0AF621.jpg
返回小木虫查看更多
今日热帖
在散点图上想要找到点分布比较密集的区域。
如图所示,希望找到分布密集的区域对应的横坐标的区间,同时可以设定一个阈值:多少算是密集的。可能有多个密集区域,希望都能找出来。
不知道用什么软件或者统计学方法可以做到。
希望大家指点一二
非常感谢

6C14311ECFF93C6AD3819D66EA0AF621.jpg
返回小木虫查看更多
自己编一个算法不就行了。KNN算法,很简单。
根据自己研究的问题,确定你这个“密度”所对应的形状和大小,加个喝出来就行
那个,如果是单因素的该如何解决,看这个点在X方向上的最密集分布,概率最大的分布区间
science有个聚类的文章就是实现你的想法的
如果我只考虑X坐标呢?就是说一组数值哪里分布最多,类似于把这些值分段,看看每段中的频率,通过频率分布判断哪一段分布最多?但我不希望分段影响,我只考虑比如聚集最密集的数值在那个区间(以总数量的1/10计)
,
我有个想法不知道可行不,用SVM分类学习应该可以处理,前提你有稠密区以及稀疏区的样本以及标签。训练过后,将所有样本进行分类就可知道范围了。