Notepad++ 是一款Windows环境下免费开源的代码编辑器,最近一直在用,默认的可能没那么好用,需要来设置和添加插件、主题,这样用起来会舒服些!以下是直接转过来的,以后用到的插件再慢慢加进来吧。
截取中文字符串的方法有很多,现整理几个常用的。 /** +---------------------------------------------------------- * 字符串截取,支持中文和其他编码 +---------------------------------------------------------- * @param string $source 需要转换的字符串 * @param string $start 开始位置 * @param string $length 截取长度 * @param string $charset 编码格式 * @param string $suffix 截断显示字符后缀 +---------------------------------------------------------- * @return string +---------------------------------------------------------- */ function xs_substr($source, $start=0, $length, $charset="utf-8", $suffix="") { if(function_exists("mb_substr")) //采用PHP自带的mb_substr截取字符串 { $string = mb_substr($source, $start, $length, $charset).$suffix; } elseif(function_exists('iconv_substr')) //采用PHP自带的iconv_substr截取字符串 { $string = iconv_substr($source,$start,$length,$charset).$suffix; } else { $pattern['utf-8'] = "/[x01-x7f]|[xc2-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3}/"; $pattern['gb2312'] = "/[x01-x7f]|[xb0-xf7][xa0-xfe]/"; $pattern['gbk'] = "/[x01-x7f]|[x81-xfe][x40-xfe]/"; $pattern['big5'] = "/[x01-x7f]|[x81-xfe]([x40-x7e]|xa1-xfe])/"; preg_match_all($pattern[$charset], $source, $match); $slice = join("",array_slice($match[0], $start, $length)); $string = $slice.$suffix; } return $string; }
一般在评论系统中会经常用到展示IP地址,但为了不全部展示IP地址,所以要对IP地址做处理:隐藏最后一位或最后两位。
有时候需要删除 Solr 中的数据(特别是不重做索引的系统中,在重做索引期间)。删除一些 Solr 无效数据(或不合格数据)。
在PHP应用下,为了更高效的对输入的关键词进行分词和搜索处理,特整理了专门的两个函数。
分享一个solr后端服务器的管理脚本 源码:
IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。
## solr 查询参数说明备忘
本文接着介绍如何使用solr来实现具体应用的搜索服务。