quentinxxz 发布的文章

一、正常情况下，不应该有这种需求

首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。
说一下，我的应用场景：用于全量建立搜索引擎的索引。这就是一种需要用到全表扫描的非一般情况。对于全表扫描的结果，我们没有排序要求。

- 更多 -

引言

做搜索技术的不可能不接触分词器。个人认为为什么搜索引擎无法被数据库所替代的原因主要有两点，一个是在数据量比较大的时候，搜索引擎的查询速度快，第二点在于，搜索引擎能做到比数据库更理解用户。第一点好理解，每当数据库的单个表大了，就是一件头疼的事，还有在较大数据量级的情况下，你让数据库去做模糊查询，那也是一件比较吃力的事（当然前缀匹配会好得多），设计上就应当避免。关于第二点，搜索引擎如何理解用户，肯定不是简单的靠匹配，这里面可以加入很多的处理，甚至加入各种自然语言处理的高级技术，而比较通用且基本的方法就是靠分词器来完成，而且这是一种比较简单而且高效的处理方法。

- 更多 -

Java实现LRU缓存

作者: quentinxxz
时间: 2015-01-15
分类: 编程语言
评论

1.Cache

Cache对于代码系统的加速与优化具有极大的作用，对于码农来说是一个很熟悉的概念。可以说，你在内存中new 了一个一段空间（比方说数组，list）存放一些冗余的结果数据，并利用这些数据完成了以空间换时间的优化目的，你就已经使用了cache。
有服务级的缓存框架，如memcache，redis等。其实，很多时候，我们在自己同一个服务内，或者单个进程内也需要缓存，例如，lucene就对搜索做了缓存，而无须依赖外界。那么，我们如何实现我们自己的缓存？还要带自动失效的，最好还是LRU（Least Recently Used）。

- 更多 -