Manning: some books about search technologies

Posted on Saturday, October 18, 2008 in books, en

Disclaimer!

None of the following links is an affiliate, and I have never personally linked to the Manning publishing.

Algorithms of the Intelligent Web

Topics of the book - search, data mining, classification, clasterisation, personal recommendations, etc.

The emphasis is on general principles and algorithms to organize the process.

The book has not yet been published (publication scheduled for March 2009), but is available for purchase through MEAP (Manning Early Access Program). Thus, what I took an advantage on. I bought it for chapters, starting with the 3rd, but decided to read from the beginning.

Collective Intelligence in Action

Very close on the first, but more attention paid to tools - Lucene, Nutch, WEKA

The press must be 17 October. Available as the most Manning-books are, in PDF format. Could not get to decide which of the two to choose, but now I tend to think that I’ll buy this one, too.

Taming Text

Again, very close to the first two, but is more specific specialization. The theme of the book - “how to cope with the unstructured text.” So far, says only half of the book is available through the MEAP.

Hibernate Search in Action

All the same search, but now in the annex to the specific technologies - Hibernate Core + Apache Lucene

Lucene in Action, Second Edition

Reissue of the famous book on the famous search framework - Lucene. Lucene - in the original Java-framework, has been ported to other languages and platforms. Lucene is the basis for other powerful and interesting projects - Hadoop, Solr and others.

Conclusion (rather passing observation):

It seems, Java finally ceased to be perceived as a “brake” even in such sensitive to the performance areas as search and processing large amounts of data. Or, in recent years has grown a generation of programmers / authors of books that are completely forgotten the C / C + +?

Manning: книги посвященные поисковым технологиям

Posted on Wednesday, October 15, 2008 in ru

Disclaimer!

Ни один из нижеследующих линков не является аффилиетским, а сам я лично никак не связан с издательством Manning*.

Algorithms of the Intelligent Web

Тематика книги - search, data mining, classification, clasterisation, personal recommendations и т.п.

Упор делается на общие принципы и алгоритмы, на организацию процесса.

Книга еще не издана (издание запланировано на март 2009), но доступна для покупки через MEAP (Manning Early Access Program). Чем я и воспользовался. Купил я ее ради глав начиная с 3-й, но решил прочитать с самого начала.

Collective Intelligence in Action

Очень близкая по тематике с первой, но здесь больше внимания уделено инструментарию - Lucene, Nutch, WEKA

В печати должна быть 17 октября (на момент написания - послезавтра). Доступна, как и большинство Manning-книг, в PDF. Никак не мог решить, какую из этих двух выбрать, но сейчас я склоняюсь к мысли, что прикуплю и эту тоже.

Taming Text

Опять же, очень близка к первым двум, но имеет более конкретную специализацию. Тема книги - “как совладать с неструктурированным текстом”. На сегодня написано только половина книги, доступна через MEAP.

Hibernate Search in Action

Все тот же поиск, но теперь в приложении к конкретным технологиям - Hibernate Core + Apache Lucene

Lucene in Action, Second Edition

Переиздание знаменитой книги, посвященной знаменитому поисковому фреймворку - Lucene. Lucene - в оригинале Java-фреймворк, была портирована** на другие языки и платформы. Lucene является базой для других мощных и интересных проектов - Hadoop, Solr и другие.

Заключение (скорее, попутное наблюдение):

Похоже, Java окончательно перестала восприниматься как “тормоз” даже в таких, чувствительных для производительности, областях как поиск и обработка больших объемов данных. Или за последние годы выросло целое поколение программистов/авторов книг, которые окончательно забыли C/С++?

——————————————————————

* - а жаль :)

** - не знаю точно почему, но мне лично кажется, что по-русски Lucene должна называться в женском роде

Английские слова, которые я выучил сегодня

Posted on Wednesday, October 15, 2008 in ru

Читаю сейчас свежеизданную книжку Энди Ханта (Andy Hunt) Pragmatic Thinking and Learning.

Написанная Программистом-Прагматиком (Pragmatic Programmer �) и ориентированная на читателя-”компьютерщика”, книга рассматривает вопрос мышления и обучения через призму соотвеисвующих понятий и представлений. Подзаголовок звучит как “рефакторинг мозга”. В книге подаются интересные модели различных аспектов мышления, процесса обучения, поведения в целом.

Но кроме полезного содержания, книжка эта порадовала меня тем, что дала мне повод выучить еще несколько (десятков?) английских слов. Вот некоторые из них:

contagious - заразный; инфекционный; передающийся непосредственно и через третьих лиц; заразительный (смех и т. п.)

pernicious - пагубный; вредный; губительный;

skewed - перекошенный; косой; искажённый;

hallmark - пробирное клеймо; проба; признак; критерий; отличительный признак; отличительная черта

indictment - обвинительный акт; обвинение; предъявление обвинения

Странно, но все слова получились с какой-то негативной окраской ;) Что это - манера автора выражать свои мысли через негативную лексику? Или, может быть, следствие избирательности памяти, которая выражается в вытеснении негативного опыта?

Как установить Git на Ubuntu

Posted on Tuesday, October 14, 2008 in ru

sudo apt-get install git-core

Внимание! Пакет Убунту, который называется git - совершенно другой инструмент, не имеющий отношения к git-средству контроля версий.

Проверяем, что все нормально


$ which git
/usr/bin/git

$ git --version
git version 1.5.4.3

Настройка интерфейса Ubuntu на VMWare Server

Posted on Wednesday, October 8, 2008 in ru

Устанавливаем VMWare Tools

Утверждается что эта штука улучшает производительность гостевой системы и общий “юзер-экспириенс”. На глазок трудно сказать, но, по крайней мере - не ухудшает :)

1. Убеждаемся что в виртуальном приводе нет никаких CD/DVD дисков (неважно. реальных или образов). Для пущей верности стоит выключить гостевую систему, привод компакт-дисков виртуальной машины перевести в автоматический режим, вынуть компакт из настоящего привода, если он там был, запустить гостевую машину.

2. В меню VMWare Server’а выбираем VM->Install VMWare Tools. Это приводит к автоматическому монтированию виртуального CD-ROM’а. Его содержимое состоит из двух файлов. Нам нужен тот, который заканчивается на gz. Перетаскиваем его прямо на рабочий стол. Раскрываем архив тут же, на месте. Открываем терминал. Набираем

Read the rest »

Ubuntu - создание учетных записей и базовая настройка среды

Posted on Monday, October 6, 2008 in ru

Обычно операцию создания аккаунтов разрешено выплнять только системному администратору, особому пользователю, который называется root. Но, поскольку root обладает практически неограниченными полномочиями, Убунту, из соображений безопасности блокирует возможность логина для root’а. Существует очень простой способ “разблокировать” root в Убунту, но я не буду на нем сейчас останавливаться. Более того, если на вновь установленной системе нет никаких других пользователей кроме root, как например в инсталляции Убунту, которую предоставляет Slicehost, - первой задачей должно быть определение нового пользователя. И пользователь этот должен обладать правом временно(т.е. для выполнения однй команды) входить в роль супер-пользователя (super user), т.е. root’а.

В Убунту, а так же в остальных Линуксах, основаных на дистрибутиве Debian, таких пользователей называют “судоеры” (sudoers).

Read the rest »

Tags: , ,

Ubuntu Linux, начало работы - названия стандартных пользовательских директорий

Posted on Sunday, October 5, 2008 in ru

Итак, Ubuntu 8.04 Desktop установлена на VMWare Server.

В дальнейшем предполагается что в качестве языка интерфейса выбран английский. Лично для меня - это язык общения с компьютером и с другими людьми через компьютер (кроме, собственно, этого блога и еще нескольких исключений).

Выбор языка интерфейса Ubuntu большого значения не имеет, но при заходе с SSH клиента все пользовательские директории (Documents, Music и т.д.) появляются в нечитабельном виде.

Поэтому, для тех кто хочет оставить русский интерфейс, и при этом иметь “нормальные” англоязычные названия директорий, вот мой маленький рецепт.

1. Идем в “Система-Администрирование-Локализации”

admin_l10n

Read the rest »

Установка гостевой Ubuntu на хосте Windows XP

Posted on Wednesday, October 1, 2008 in Setups

Дано:

Ноутбук Dell Inspiron 6400 с 2Гб памяти, Intel Core Duo 2ГГц, 160Гб диск, Windows XP Professional SP2.

Цель:

Получить рабочую среду, готовую для установки и настройки open-source инструментария (веб)разработчика: LAMP(Linux, Apache, MySQL, PHP/Perl/Python), Ruby, Rails, git, Capistrano и других.

Описание процесса

Скачать дистрибутив Ubuntu Linux.

http://www.ubuntu.com/getubuntu/download

ubuntu-download

Внимание! Нет никакой необходимости “прожигать” свежескачанный образ на пустую “болванку”. Нужно только сохранить файл .iso на жесткий диск.

Read the rest »

My music selection makes last.fm look good

You can't see my music, but that doesn't mean it's not there.

This theme was designed by Chris Wallace and is licensed under the GNU General Public License.

Check out his cool WordPress Themes. Released by Six Revisions in the year of the rat.