一个HashSet导致的排序问题

问题描述

有一个对外提供指标组信息的接口，返回内容为包含多个指标组信息的数组。接口要求返回的指标组，必须按照数据库中的权重字段(weight)的值排序。

相关的SQL语句中，已经添加了这个排序逻辑，但是发现最终接口展示的结果，却并未按照这个逻辑排序。

原因排查

查看了程序逻辑，大致流程如下：

1、通过SQL语句查询数据库，并处理排序逻辑

2、程序中获取指标组的id列表

3、从缓存信息中取出指标属性，封装结果

4、输出接口数据

其中1、3、4都确认没有问题，怀疑问题是出在2这个环节。然后程序中打印输出信息，发现数据库查询出来的指标组id，在我们手动取出来并赋值给变量后，顺序发生了变化。

我们是将这部分id，保存在了一个HashSet中(因为查询出来的信息可能存在重复，所以用了一个可以去重的集合)。

问题的原因找到了：

HashSet会对存入的数据重新排序，导致顺序和存入之前会不一致。

解决方案

用LinkedHashSet替代了HashSet.

几种Set的区别

可以参考这个文章：https://www.cnblogs.com/Terry-greener/archive/2011/12/02/2271707.html

Set接口

Set不允许包含相同的元素，如果试图把两个相同元素加入同一个集合中，add方法返回false。
Set判断两个对象相同不是使用==运算符，而是根据equals方法。也就是说，只要两个对象用equals方法比较返回true，Set就不会接受这两个对象。

HashSet

HashSet有以下特点
 不能保证元素的排列顺序，顺序有可能发生变化
 不是同步的
 集合元素可以是null,但只能放入一个null
当向HashSet结合中存入一个元素时，HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值，然后根据 hashCode值来决定该对象在HashSet中存储位置。
简单的说，HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等，并且两个对象的hashCode()方法返回值相等
注意，如果要把一个对象放入HashSet中，重写该对象对应类的equals方法，也应该重写其hashCode()方法。其规则是如果两个对象通过equals方法比较返回true时，其hashCode也应该相同。另外，对象中用作equals比较标准的属性，都应该用来计算 hashCode的值。

LinkedHashSet

LinkedHashSet集合同样是根据元素的hashCode值来决定元素的存储位置，但是它同时使用链表维护元素的次序。这样使得元素看起来像是以插入顺序保存的，也就是说，当遍历该集合时候，LinkedHashSet将会以元素的添加顺序访问集合的元素。
LinkedHashSet在迭代访问Set中的全部元素时，性能比HashSet好，但是插入时性能稍微逊色于HashSet。

TreeSet类

TreeSet是SortedSet接口的唯一实现类，TreeSet可以确保集合元素处于排序状态。

TreeSet支持两种排序方式，自然排序和定制排序，其中自然排序为默认的排序方式。向TreeSet中加入的应该是同一个类的对象。
TreeSet判断两个对象不相等的方式是两个对象通过equals方法返回false，或者通过CompareTo方法比较没有返回0
自然排序
自然排序使用要排序元素的CompareTo（Object obj）方法来比较元素之间大小关系，然后将元素按照升序排列。
Java提供了一个Comparable接口，该接口里定义了一个compareTo(Object obj)方法，该方法返回一个整数值，实现了该接口的对象就可以比较大小。
obj1.compareTo(obj2)方法如果返回0，则说明被比较的两个对象相等，如果返回一个正数，则表明obj1大于obj2，如果是负数，则表明obj1小于obj2。
如果我们将两个对象的equals方法总是返回true，则这两个对象的compareTo方法返回应该返回0
定制排序
自然排序是根据集合元素的大小，以升序排列，如果要定制排序，应该使用Comparator接口，实现 int compare(T o1,T o2)方法

测试代码

import java.util.ArrayList;
import java.util.HashSet;

public class LinkedHashSetTest
{
    public static void main(String[] args) {
        ArrayList<Integer> raw = new ArrayList<>();
        raw.add(148);
        raw.add(152);
        raw.add(149);
        raw.add(150);
        raw.add(151);
        raw.add(151);
        raw.add(151);
        raw.add(153);

        ArrayList<Integer> inc = new ArrayList<>();
        inc.add(100);
        inc.add(101);
        inc.add(104);
        inc.add(102);
        inc.add(103);
        inc.add(103);
        inc.add(103);
        inc.add(103);
        inc.add(105);

        raw.addAll(inc);
        System.out.println("List : " + raw);

//        LinkedHashSet<Integer> set = new LinkedHashSet<>(raw);
        HashSet<Integer> set = new HashSet<>(raw);

        System.out.println("-------------LinkedHashSet-------------");
        for (int id : set) {
            System.out.println(id);
        }
    }
}

#Java

kafka常用命令与常见问题上一篇

用jmeter对websocket应用进行性能测试下一篇