python 实现在无序数组中找到中位数方法

作者：低调pasta_730 | 2021-10-22 20:55

这篇文章主要介绍了python实现在无序数组中找到中位数方法，具有很好对参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

一、问题描述

1、求一个无序数组的中位数，（若数组是偶数，则中位数是指中间两个数字之和除以2，若数组是奇数，则中位数是指最中间位置。要求：不能使用排序，时间复杂度尽量低

2、例如：

lists = [3, 2, 1, 4] , 中位数为 = (2+3)/2 = 2.5
lists = [3, 1, 2] , 中位数为 2

3、算法思想：

利用快速排序思想（但是并不是全部使用）：任意挑选一个元素，以该元素为key，划分数组为两个部分，如果左侧数组长度刚好为(n-1)/2, 那么key就为中位数，若左侧数组长度 < (n-1)/2 ，那么中位数点在右侧，反之，中位数在左侧。然后进入相应的一侧继续寻找中位

平均时间复杂度为O(n)

二、程序

class Solution(object):
 
 def findmedian(self, lists):
  if not lists or len(lists) == 0:
   return []
 
  n = len(lists)
  if n % 2 == 0:
   a = self.partition(lists, n/2, 0, n-1)
   b = self.partition(lists, n/2-1, 0, n-1)
   mid = (lists[a]+lists[b])/ (2 * 1.0)
   return mid
  else:
   mid = self.partition(lists, n/2, 0, n-1)
   return lists[mid]
 
 def partition(self, lists, k, start, end):
 
  key = lists[start]
  left, right = start, end
 
  while left < right:
   while left < right and lists[right] > key:
    right = right - 1
   lists[left] = lists[right]
 
   while left < right and lists[left] < key:
    left = left + 1
   lists[right] = lists[left]
 
  lists[left] = key
 
  if left == k:
   return left
  elif left > k:
   return self.partition(lists, k, start, left-1)
  else:
   return self.partition(lists, k, left+1, end)
 
 
if __name__ == "__main__":
 
 sol = Solution()
 lists = [2, 5, 4, 9, 3, 6, 8, 7, 1]
 # lists = [1, 2]
 
 
 data = sol.findmedian(lists)
 print("中位数 = %s" % data)

知识补充：python streaming 实现某个字段排序

一，hadoop streaming默认情况

1，在hadoop streaming的默认情况下，是以\t作为分隔符的，标准输入时，每行的第一个\t之前的内容作为key，第一个\t之后的内容作为value。注意，如果一个\t字符都没有，那么整行作为key。

2，streaming的一些参数如下：

-D stream.map.output.field.separator ：设置map输出中key和value的分隔符
-D stream.num.map.output.key.fields ：设置map程序分隔符的位置，该位置之前的部分作为key，之后的部分作为value
-D map.output.key.field.separator : 设置map输出中key内部的分割符
-D num.key.fields.for.partition : 指定分桶时，key按照分隔符切割后，其中用于分桶key所占的列数（配合-partitioner org.apache.hadoop.mapred.lib.KeyFieldBasedPartitioner 使用）
-D stream.reduce.output.field.separator：设置reduce输出中key和value的分隔符
-D stream.num.reduce.output.key.fields：设置reduce程序分隔符的位置

二，python streaming 实现某个字段的排序

1，输入数据: cat data.txt (中间是tab键）

11 2
11 3
11 4 1
11 1

11 12 22

2，streaming程序如下：

vim sorted.sh

#!/bin/bash

export CURRENT=/home/chunhe.liao/hadoop_streaming/sort

/usr/local/hadoop-2.6.3/bin/hadoop jar /usr/local/hadoop-2.6.3/share/hadoop/tools/lib/hadoop-streaming-2.6.3.jar \
-D stream.map.output.field.separator='\t' \
-D stream.num.map.output.key.fields=3 \
-D mapreduce.job.output.key.comparator.class=org.apache.hadoop.mapreduce.lib.partition.KeyFieldBasedComparator \
-D mapreduce.partition.keycomparator.options=-k3,3nr \  # 按照第三列逆序排列,可以根据想要的第几段来选择。
-input "/user/test/inputdata/datas3/data.txt" \
-output "/user/test/streaming/sorted_20180711" \
-mapper "python mapper.py" \
-reducer "python reducer.py" \
-file "$CURRENT/mapper.py" \
-file "$CURRENT/reducer.py"

(2) mapper.py

# -*- coding: utf-8 -*-
import sys
 
for line in sys.stdin:
 line = line.strip()
 print('{0}'.format(line))

(3) reducer.py

# -*- coding: utf-8 -*-
import sys
 
for line in sys.stdin:
 line = line.strip()
 print("{0}".format(line))

运行命令：

bash sorted.sh

运行结果：

hdfs dfs -cat /user/test/streaming/sorted_20180711/part-00000

11 12 22
11 3
11 2
11 4 1
11 1

以上这篇python 实现在无序数组中找到中位数方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

推荐阅读

程序员
查找具有格式不佳的结束标记的特定HTML标记

如何解决《查找具有格式不佳的结束标记的特定HTML标记》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何修复“找不到GLEW（丢失：GLEW_INCLUDE_DIR GLEW_LIBRARY）”

如何解决《如何修复“找不到GLEW（丢失：GLEW_INCLUDE_DIRGLEW_LIBRARY）”》经验，为你挑选了1个好方法。 ... [详细]
程序员
VideoView不在RecyclerView中播放视频或音频

如何解决《VideoView不在RecyclerView中播放视频或音频》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用C++ strtk导致xutility错误C4996

如何解决《使用C++strtk导致xutility错误C4996》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何跳过if语句转到下一个if语句

如何解决《如何跳过if语句转到下一个if语句》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gradle依赖树,(*)是什么意思？

如何解决《Gradle依赖树,(*)是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将时间戳与描述分组

如何解决《将时间戳与描述分组》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么不应该将PostGIS安装在PostgreSQL数据库“ postgres”中？

如何解决《为什么不应该将PostGIS安装在PostgreSQL数据库“postgres”中？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将Excel行读取为数组:PHPExcel是否具有fgetcsv()等效项？

如何解决《将Excel行读取为数组:PHPExcel是否具有fgetcsv()等效项？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在python中对一个2d numpy数组进行下采样

如何解决《在python中对一个2dnumpy数组进行下采样》经验，为你挑选了1个好方法。 ... [详细]
程序员
传递一个数组

如何解决《传递一个数组》经验，为你挑选了2个好方法。 ... [详细]
程序员
D3.js时间刻度刻度线-仅年份和月份-自定义时间格式

如何解决《D3.js时间刻度刻度线-仅年份和月份-自定义时间格式》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在rxjs中使用节点的变换流？

如何解决《如何在rxjs中使用节点的变换流？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Visual Studio 2015 Community Edition是否具有MVC模板？

如何解决《VisualStudio2015CommunityEdition是否具有MVC模板？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将Django Rest Framework的默认URL更改为自定义

如何解决《如何将DjangoRestFramework的默认URL更改为自定义》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring中的单元测试:将依赖项注入正在测试的组件中

如何解决《Spring中的单元测试:将依赖项注入正在测试的组件中》经验，为你挑选了1个好方法。 ... [详细]
程序员
我应该使用printf("\n")还是putchar('\n')在C中打印换行符？

如何解决《我应该使用printf("\n")还是putchar('\n')在C中打印换行符？》经验，为你挑选了3个好方法。 ... [详细]
程序员
ES6课程不适用于Chrome 47

如何解决《ES6课程不适用于Chrome47》经验，为你挑选了1个好方法。 ... [详细]
程序员
将列表复制到其他列表中

如何解决《将列表复制到其他列表中》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring websocket @messagemapping反序列化问题java.lang.ClassCastException:java.util.LinkedHashMap无法强制转换

如何解决《Springwebsocket@messagemapping反序列化问题java.lang.ClassCastException:java.util.LinkedHashMap无法强制转换》经验，为你挑选了0个好方法。 ... [详细]

低调pasta_730

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章