JavaScript 数组的 uniq 方法

网络编程 2024/11/16 佚名

3 2 1

无为清净楼资源网 Design By www.qnjia.com

给Array本地对象增加一个原型方法，它的用途是删除数组条目中重复的条目(可能有多个)，返回值是一个包含被删除的重复条目的新数组。

形式化描述：
input
Array(size=N)
output
Array1=Array的无重复保序的子集，
无重复是指，对任意a,b属于Array1，a!=b
保序是指，若a在Array的下标小于b在Array的下标，则a在Array1中的下标也小于b在Array的下标
Array2=Array-Array1，保序
realazy给出了一个新解，思路非常清晰：顺序遍历访问每个元素，如果这个元素的值已经访问过了，则加入Array2，否则加入Array1。判断当前元素的值是否已经访问过所采用的方法是顺序遍历已经访问过的所有元素。
易见该算法复杂度约O(N^2)。

我在他的算法框架下稍微做了一些改进，关键在于遍历过程中如何判断当前元素的值是否已经访问过。在原数组值域为正整数且极差（range=max value-min value）不太大的条件下，可以采用简单的"桶"算法。
准备一个长度为range的boolean数组b，初始化全为false。对于原数组中每个值value，如果b[value]=true，则表明这个值访问过，放入Array2，否则放入Array1同时令b[value]=true。
这显然是O(N)的算法，代价是额外的空间复杂度range，而且要求原数组值域为正整数。
不难推广到值域为整数的情形，事实上只需考察桶号value-min(Array)即可转化为正整数的情形。

为了避免range太大造成的空间的浪费，在"桶"算法基础上改进为散列算法，具体说来是线性同余开散列法。目的是将值域压缩映射到一个可控的小的连续正整数子集中，同时保证不同的原象对应的相同的象的概率要尽可能小，也就是说桶与桶之间要尽量负载均衡。
例如这是一个值域为实数的散列函数：
key=hashFun(value)=Math.floor(value)*37%91
这仍然是O(N)的算法，（显然O(N)是所有uniq算法的复杂度下界），好处是可以控制空间的开销，而且可以适应非整数值域，只需要设计相应的散列函数即可。

下面是桶(bucket)算法的实现：
   var resultArr = [],
       returnArr = [],
       origLen = this.length,
       resultLen;
   var maxv=this[0],minv=this[0];
   for (var i=1; i<origLen; ++i){
       if(this[i]>maxv)maxv=this[i];
       else if(this[i]<minv)minv=this[i];
   }
   var blen=maxv-minv+1;
   var b=new Array(blen);
   for(var i=0;i<blen;++i)b[i]=false;
   for (var i=0; i<origLen; ++i){
       if (b[this[i]-minv]){
           returnArr.push(this[i]);
       } else {
           resultArr.push(this[i]);
           b[this[i]-minv]=true;
       }
   }
   resultLen = resultArr.length;
   this.length = resultLen;
   for (var i=0; i<resultLen; ++i){
       this[i] = resultArr[i];
   }
   return returnArr;
下面是散列(hash)算法的实现
var shuffler = 37
var beta=0.007;
var origLen=this.length
var bucketSize=Math.ceil(origLen*beta);
var hashSet=new Array(bucketSize);
var hashFun = function(value){
var key = (Math.floor(value)*shuffler)%bucketSize;
return key;
}
//init hashSet
for(var i=0;i<bucketSize;i++)hashSet[i]=new Array();
//
var ret=[],self=[];
var key,value;
var bucket,openLen;
var everConflict;
for(var i=0;i<origLen;i++){
value=this[i];
key=hashFun(value);
bucket = hashSet[key];
openLen=bucket.length;//if(openLen>1)return;
everConflict=false;
for(var j=0;j<openLen;j++){
if(bucket[j]==value){
  ret.push(value);
  everConflict=true;
  break;
}
}
if(!everConflict){
bucket.push(value);
self.push(value);
}
}
   selfLen = self.length;
   this.length = selfLen;
   for (i=0; i<selfLen; ++i){
       this[i] = self[i];
   }
//compute average bucket size
var lens=[],sum=0;
for(var i=0;i<hashSet.length ;++i){lens.push(hashSet[i].length);sum+=hashSet[i].length};
average=sum/hashSet.length;//watch lens,average
   return ret;

用k*10000个0~k*100的随机整数测试计算时间(ms)
k 1 2 3 4 5
realazy 240 693 1399 2301 3807
bucket 55 101 141 219 293
hash 214 411 654 844 1083
测试框架借鉴了http://realazy.org/lab/uniq.html
测试环境Firefox2.0.0.6/Ubuntu7.10/2.66GHzP4/1024MBDDR

JavaScript,数组,uniq

标签：

JavaScript,数组,uniq

无为清净楼资源网 Design By www.qnjia.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

无为清净楼资源网 Design By www.qnjia.com

评论“JavaScript 数组的 uniq 方法”

暂无评论...

www.qnjia.com 无为清净楼资源网

139,976互联网资源

144,792高清电影

21,817无损音乐

631,128技术资源

最新文章

坣娜.1997-你怎么可以不爱我【巨石】【WAV+

2024/11/16

群星.1992-暗恋桃花源电影原声带【滚石】【

2024/11/16

林隆璇.1989-愤怒的情歌【巨石】【WAV+CUE】

2024/11/16

勤琴《海上花》[DTS-WAV分轨]

2024/11/16

群星《歌声有故事》[DTS-WAV分轨]

2024/11/16

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/11/16

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

JavaScript 数组的 uniq 方法

JavaScript,数组,uniq

js菜单代码js菜单特效代码

Javascript 更新 JavaScript 数组的 uniq 方法

评论“JavaScript 数组的 uniq 方法”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

JavaScript 数组的 uniq 方法

JavaScript,数组,uniq

js菜单代码js菜单特效代码

Javascript 更新 JavaScript 数组的 uniq 方法

评论“JavaScript 数组的 uniq 方法”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存