<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: Обзор решений для полнотекстового поиска в веб-проектах: Sphinx, Apache Lucene, Xapian</title>
	<atom:link href="http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/</link>
	<description>сообщество программистов</description>
	<lastBuildDate>Fri, 19 Mar 2010 19:57:08 +0200</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>By: Max Lavrenov</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-84837</link>
		<dc:creator>Max Lavrenov</dc:creator>
		<pubDate>Mon, 30 Nov 2009 06:07:34 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-84837</guid>
		<description>А разве  value в документах ксапиана это не то, что вы называете &quot;дополнительные типы полей в документах&quot; ? Вроде все, что вы перечисляете там поддерживается.</description>
		<content:encoded><![CDATA[<p>А разве  value в документах ксапиана это не то, что вы называете &#8220;дополнительные типы полей в документах&#8221; ? Вроде все, что вы перечисляете там поддерживается.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Vitaliy Yermolenko</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-21192</link>
		<dc:creator>Vitaliy Yermolenko</dc:creator>
		<pubDate>Thu, 31 Jul 2008 13:42:20 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-21192</guid>
		<description>Рано еще делать выводы: не забудьте о &lt;a href=&quot;http://hyperestraier.sourceforge.net/&quot; rel=&quot;nofollow&quot;&gt;Hyper Estraier&lt;/a&gt;, plz.</description>
		<content:encoded><![CDATA[<p>Рано еще делать выводы: не забудьте о <a href="http://hyperestraier.sourceforge.net/" rel="nofollow">Hyper Estraier</a>, plz.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: aleks_raiden</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-20405</link>
		<dc:creator>aleks_raiden</dc:creator>
		<pubDate>Mon, 28 Jul 2008 07:17:46 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-20405</guid>
		<description>SKeeper - ну, Nutch это уже реальный и серьёзный поисковик уровня... ну скажем, городского или даже отраслевого (не яндекс конечно, но тоже уровень). А Lucene это промышленного уровня поисковое ядро, универсальное и потому не самое простое :)</description>
		<content:encoded><![CDATA[<p>SKeeper &#8211; ну, Nutch это уже реальный и серьёзный поисковик уровня&#8230; ну скажем, городского или даже отраслевого (не яндекс конечно, но тоже уровень). А Lucene это промышленного уровня поисковое ядро, универсальное и потому не самое простое <img src='http://www.developers.org.ua/wordpress/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>By: SKeeper</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-20398</link>
		<dc:creator>SKeeper</dc:creator>
		<pubDate>Mon, 28 Jul 2008 07:07:12 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-20398</guid>
		<description>Некоторое время копал Nutch и Lucene - достаточно монструозная штука, видимо я не дорос до тех задач, где это можно применить :)

А mnogosearch кто-нить пробовал? Для него есть пхп-модули. Ну и, ИМХО: для поиска по своему локальному проекту неплохая вещь.</description>
		<content:encoded><![CDATA[<p>Некоторое время копал Nutch и Lucene &#8211; достаточно монструозная штука, видимо я не дорос до тех задач, где это можно применить <img src='http://www.developers.org.ua/wordpress/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>А mnogosearch кто-нить пробовал? Для него есть пхп-модули. Ну и, ИМХО: для поиска по своему локальному проекту неплохая вещь.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: http://bananos.livejournal.com/</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-19784</link>
		<dc:creator>http://bananos.livejournal.com/</dc:creator>
		<pubDate>Sat, 26 Jul 2008 14:49:44 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-19784</guid>
		<description>Реально делали отдельное решение для поиска. В начале попробовали Sphinx, ибо все крутилось на Мускуле, забили т.к. немного нетривиально настраивать, и неудобное на мой взгляд API.
На Xapian посмотрели только издалека, ибо была только либа (вот тут упомянули что есть уже отдельное приложение Omega, думаю стоит посмотреть).

В итоге остановились на Solr -- на мой взгляд самое простое и безгеморное решение. Единственная проблема с которой там столкнулись -- это настройка русского стеммера и вещей типа SpellCheck + SearchSuggest (увы, так и не заработало)
Интерфейс общения c основным CakePHP приложением - JSON, связка работает на ура.
Всем советую Solr.</description>
		<content:encoded><![CDATA[<p>Реально делали отдельное решение для поиска. В начале попробовали Sphinx, ибо все крутилось на Мускуле, забили т.к. немного нетривиально настраивать, и неудобное на мой взгляд API.<br />
На Xapian посмотрели только издалека, ибо была только либа (вот тут упомянули что есть уже отдельное приложение Omega, думаю стоит посмотреть).</p>
<p>В итоге остановились на Solr &#8212; на мой взгляд самое простое и безгеморное решение. Единственная проблема с которой там столкнулись &#8212; это настройка русского стеммера и вещей типа SpellCheck + SearchSuggest (увы, так и не заработало)<br />
Интерфейс общения c основным CakePHP приложением &#8211; JSON, связка работает на ура.<br />
Всем советую Solr.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Щетинин Сергей</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-19121</link>
		<dc:creator>Щетинин Сергей</dc:creator>
		<pubDate>Thu, 24 Jul 2008 21:20:38 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-19121</guid>
		<description>Та их много, просто Гугл какбы немного доказал ...

Если уж копать то очень много всего
http://en.wikipedia.org/wiki/Enterprise_search
http://en.wikipedia.org/wiki/List_of_search_engines
http://en.wikipedia.org/wiki/Category:Free_search_engine_software

Вообще статья хорошая но изложено с такой позиции мол технология всё решает:
&lt;blockquote&gt;Среди проектов, которые мы рассмотрим, присутствует один сервер, именно реализующий веб-поисковик, то есть содержит все необходимое для создания “убийцы Яндекса”.&lt;/blockquote&gt;
Всё необходимое в смысле штат работников знающий технологию как облупленную, всё время дорабатывающий и тюнящий алгоритмы, люди банящие сайты находящие дырки в алгоритмах, исследующие рынок итд итд итд итд итд итд итд? Кто там последний в убийцы Яндекса метил.. Въебальта? Гугл не смотря на лучшие алгоритмы и баблос вроде как еще не убил, а вот щас мы тут увидим чудо-технологию которая... это несерьезно.

Понятно что поиск очень нетривиальная задача и лично я предпочел бы чтобы ей занимались те, для кого это профессия (не только разработкой но и поддержкой итд).</description>
		<content:encoded><![CDATA[<p>Та их много, просто Гугл какбы немного доказал &#8230;</p>
<p>Если уж копать то очень много всего<br />
<a href="http://en.wikipedia.org/wiki/Enterprise_search" rel="nofollow">http://en.wikipedia.org/wiki/Enterprise_search</a><br />
<a href="http://en.wikipedia.org/wiki/List_of_search_engines" rel="nofollow">http://en.wikipedia.org/wiki/List_of_search_engines</a><br />
<a href="http://en.wikipedia.org/wiki/Category:Free_search_engine_software" rel="nofollow">http://en.wikipedia.org/wiki/Category:Free_search_engine_software</a></p>
<p>Вообще статья хорошая но изложено с такой позиции мол технология всё решает:</p>
<blockquote><p>Среди проектов, которые мы рассмотрим, присутствует один сервер, именно реализующий веб-поисковик, то есть содержит все необходимое для создания “убийцы Яндекса”.</p></blockquote>
<p>Всё необходимое в смысле штат работников знающий технологию как облупленную, всё время дорабатывающий и тюнящий алгоритмы, люди банящие сайты находящие дырки в алгоритмах, исследующие рынок итд итд итд итд итд итд итд? Кто там последний в убийцы Яндекса метил.. Въебальта? Гугл не смотря на лучшие алгоритмы и баблос вроде как еще не убил, а вот щас мы тут увидим чудо-технологию которая&#8230; это несерьезно.</p>
<p>Понятно что поиск очень нетривиальная задача и лично я предпочел бы чтобы ей занимались те, для кого это профессия (не только разработкой но и поддержкой итд).</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Сергей Волошин</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-19103</link>
		<dc:creator>Сергей Волошин</dc:creator>
		<pubDate>Thu, 24 Jul 2008 20:34:32 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-19103</guid>
		<description>&lt;blockquote&gt;Это наверное меня Lucene так травмировало, что теперь не хочу с этим всем иметь дела )&lt;/blockquote&gt;
Ну если бы Lucene был очень хорошим, не появилось бы Solr etc.

&lt;blockquote&gt;На ДОУ кстати Google Site Search. Search API это децл другое.&lt;/blockquote&gt;
Ясно.  Через API ДОУ немного работает с Google Calendar.

Еще такое есть:
&lt;a href=&quot;http://www.ashmanov.com/tech/search/&quot; rel=&quot;nofollow&quot;&gt;http://www.ashmanov.com/tech/search/&lt;/a&gt;
(не знаю другое ли это и насколько).</description>
		<content:encoded><![CDATA[<blockquote><p>Это наверное меня Lucene так травмировало, что теперь не хочу с этим всем иметь дела )</p></blockquote>
<p>Ну если бы Lucene был очень хорошим, не появилось бы Solr etc.</p>
<blockquote><p>На ДОУ кстати Google Site Search. Search API это децл другое.</p></blockquote>
<p>Ясно.  Через API ДОУ немного работает с Google Calendar.</p>
<p>Еще такое есть:<br />
<a href="http://www.ashmanov.com/tech/search/" rel="nofollow">http://www.ashmanov.com/tech/search/</a><br />
(не знаю другое ли это и насколько).</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Щетинин Сергей</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-19094</link>
		<dc:creator>Щетинин Сергей</dc:creator>
		<pubDate>Thu, 24 Jul 2008 20:06:12 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-19094</guid>
		<description>Это наверное меня Lucene так травмировало, что теперь не хочу с этим всем иметь дела )
Но в любом случае если примерить всё это на проект побольше то цена использования возрастает далеко не линейно.

На ДОУ кстати Google Site Search. Search API это децл другое.</description>
		<content:encoded><![CDATA[<p>Это наверное меня Lucene так травмировало, что теперь не хочу с этим всем иметь дела )<br />
Но в любом случае если примерить всё это на проект побольше то цена использования возрастает далеко не линейно.</p>
<p>На ДОУ кстати Google Site Search. Search API это децл другое.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Сергей Волошин</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-19087</link>
		<dc:creator>Сергей Волошин</dc:creator>
		<pubDate>Thu, 24 Jul 2008 19:52:57 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-19087</guid>
		<description>Ну вон Сагалаев, сорри, еще раз ссылка, которая есть в статье:
&lt;a href=&quot;http://softwaremaniacs.org/blog/2007/11/04/sphinx-search-in-cicero/&quot; rel=&quot;nofollow&quot;&gt;http://softwaremaniacs.org/blog/2007/11/04/sphinx-search-in-cicero/&lt;/a&gt;
вроде без особых трудностей и гурманства прикрутил Sphinx к Cicero.

А вот &lt;a href=&quot;http://pravda.com.ua/&quot; rel=&quot;nofollow&quot;&gt;pravda.com.ua/&lt;/a&gt; использует поиск от Яндекса.

На developers.org.ua думаю обойдемся поиском Google.</description>
		<content:encoded><![CDATA[<p>Ну вон Сагалаев, сорри, еще раз ссылка, которая есть в статье:<br />
<a href="http://softwaremaniacs.org/blog/2007/11/04/sphinx-search-in-cicero/" rel="nofollow">http://softwaremaniacs.org/blog/2007/11/04/sphinx-search-in-cicero/</a><br />
вроде без особых трудностей и гурманства прикрутил Sphinx к Cicero.</p>
<p>А вот <a href="http://pravda.com.ua/" rel="nofollow">pravda.com.ua/</a> использует поиск от Яндекса.</p>
<p>На developers.org.ua думаю обойдемся поиском Google.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Щетинин Сергей</title>
		<link>http://www.developers.org.ua/archives/aleks_raiden/2008/07/24/full-text-search-engines-overview-sphinx-apache-lucene-xapian/#comment-19079</link>
		<dc:creator>Щетинин Сергей</dc:creator>
		<pubDate>Thu, 24 Jul 2008 19:41:50 +0000</pubDate>
		<guid isPermaLink="false">http://www.developers.org.ua/index.php?p=1345#comment-19079</guid>
		<description>Если весь контент сайта в любом случае публично доступен то для неструктурированного поиска вполне подходит Google Search API. Если контент скрыт -- я бы в первую очередь смотрел на их же Appliance. Если поиск нужен стуктурированный, то для этого обычные БД хороши. И только в случае когда так или иначе нужно с тем самым Гуглом конкурировать (пусть в своей песочнице) вот тогда уже оправдано точить какой-то отдельный движок. Ну или если ресурсов немеряно и хочется всё совсем по-гурмански сделать. Такое моё мнение.</description>
		<content:encoded><![CDATA[<p>Если весь контент сайта в любом случае публично доступен то для неструктурированного поиска вполне подходит Google Search API. Если контент скрыт &#8212; я бы в первую очередь смотрел на их же Appliance. Если поиск нужен стуктурированный, то для этого обычные БД хороши. И только в случае когда так или иначе нужно с тем самым Гуглом конкурировать (пусть в своей песочнице) вот тогда уже оправдано точить какой-то отдельный движок. Ну или если ресурсов немеряно и хочется всё совсем по-гурмански сделать. Такое моё мнение.</p>
]]></content:encoded>
	</item>
</channel>
</rss>
