Если это ваш первый визит, рекомендуем почитать справку по форуму. Для размещения своих сообщений необходимо зарегистрироваться. Для просмотра сообщений выберите раздел. |
Задание за деньги. |
Философия, технологии, алгоритмы! |
|
Опции темы |
14.08.2007, 17:32 | #1 |
Vulture[BUG]
Сообщений: 899
Регистрация: 21.05.2005
Возраст: 37
Не в сети |
Задание за деньги.
Готов выслушать ваши прделожения по стоимости исполнения следующего проекта:
Приложение должно обеспечивать: 1.Хранение информации о примерах текстовых документов. 2.Просмотр и модификацию содержимого базы данных примеров текстовых документов. 3.Построение функции определения степени «ключевизны» слова. 4.Выделение ключевых слов произвольного документа. 5.Хранение, просмотр и редактирование древовидного рубрикатора, позволяющего организовать каталоги и подкаталоги документов. 6.Хранение ключевых слов для каждой рубрики. Кратко смысл таков: есть документ, мы находим в нем ключевые слова, просматриваем ключевые слова по рубрикам (некоторое начальное количество рубрик задает пользователь), при достаточном совпадении кидаем документ в эту рубрику. Для данного проекта есть описание и анализ задачи. Необходимо собственно реализация c построением базы в interbase или mysql ну и тд... Я еще не решил отадм проект или сделаю сам, так что пока просчитываю варианты. Слушаю ваши предложения цены (можно в приват) одно маленькое но, Delphi называется. Планируется реализация в дельфях. Но все возможно, я благодарен всем кто откликнулся, буду думать |
14.08.2007, 22:37 | #4 |
Vulture[BUG]
Сообщений: 899
Регистрация: 21.05.2005
Возраст: 37
Не в сети |
Смысл написать прогу, которая обрабатывала бы документы текстовые , выделяла из них ключевые слова по определенным правилам(пока основа - частотный словарь с исключением символов, которые не могут являться ключевыми словами (точки, символы + = и тд...) и заносила документы по рубрикам (опять же по некоторому алгоритму зависящему от ключевых слов (некоего коэффициента) и того же коэффициента ключевых слов документов находящихся уже в рубрике).
Начальные данные, на основе которых будет происходить занесение по рубрикам (что-то вроде шаблона) заполняется экспертом (программистом 8)). + База в интербейзе (желательно) Еще вопросы? |
15.08.2007, 01:27 | #5 | ||
хЕрург
Сообщений: 3,857
Регистрация: 05.02.2006
Возраст: 43
Не в сети |
Strucka, я походу дебил..... никуя не понял понял тока что есть куча текстовых документов (т.е. в тхт формате) из них нужно выбирать из них какие-то слова, которые уже есть в какомто словаре без каких-то символов, затем по какомуто правилу распределять эти доки по каталогам. Причем словарь здесь - не понятно.... что такое частотный словарь - совсем не понятно.
Цитата:
Strucka, без обид, ты сам-то четко понимаешь чо сделать нада? MR_Romik, ты чонить понял? Цитата:
|
||
15.08.2007, 07:57 | #6 |
///
Сообщений: 9,724
Регистрация: 02.04.2005
Возраст: 43
Не в сети |
doXtor,
неужели непонятно, еще один человек захотел сделать "свой яндекс" и грести бабло до конца жизни. Но как всегда, хочется, чтобы напрягся кто-то другой. Когда речь зайдет о цене он будет удивленно спрашивать "а почему так дорого?". Зайди на freelance.ru там таких пруд пруди. Если я ошибаюсь, мои извинения форумцу Strucka |
15.08.2007, 08:26 | #7 |
Форумец
Сообщений: 370
Регистрация: 08.02.2007
Возраст: 39
Не в сети |
doXtor, НЕ только ты дебил, я неверное тоже дебил! -=Женек=-, Если это то..., то смысл это творить на дельфях и в интербезе?
Помоему просто смахивает на задание из института(там практика или еще что то), я прав |
15.08.2007, 08:41 | #8 |
///
Сообщений: 9,724
Регистрация: 02.04.2005
Возраст: 43
Не в сети |
MR_Romik, а что, обязательно скриптованый язык надо использовать? Я одно время для локалки делал поисковую систему ( так и не доделал ((( ) - так я в C++ Builder делал и мне это казалось более рациональным.
|
15.08.2007, 18:05 | #10 | |
Vulture[BUG]
Сообщений: 899
Регистрация: 21.05.2005
Возраст: 37
Не в сети |
Цитата:
Под декстовыми документами понималось не документы с расширением ткст, а документы , которые могут содержать текст (там вордовские файлы итд). Что должна делать прога: 1.Обрабатывать документ и выделять ключевые слова по след принципу: создать частотный словарь (посчитать количество слов). При этом из выборки должны быть исключены некоторые "слова" (типа ы а ц у к ( ) * & # . < / ) ,а затем полученные данные разделить на кол-во слов в документе (общее кол-во) (пока такой способ). 2. Вычислять коэфф. ключевизны слова (об этом подробнее могу выслать файло, потому как долго объяснять) 3. ПО вычислениям в 1. и 2. оперделять документ в рубрику по принципу: а)сначала вручную создается рубрика и в нее записывается выбранный экспертом документ, и для него программно определяется 1. и 2.; а для рубрики зааются вручную ключевые слова по которым в нее определять документы (ну и считаются 1. и 2. для выброанного списка таких слов по всем документам , которые находятся в рубрике). б)новый документ после 1. и 2. проходит сравнение своим списком ключевых слов с таким списком у рубрик, и заносится в соответствующую. 4. Если юзер хочет новую рубрику, то он должен задать для нее начальные параметры (см.3.а) 5. Ну и юзерь естесно может осуществить поиск(по рубрикам, или задав набор слов ему в качестве рез-та список доков , которые могли бы его заинтересовать, ну и рубрика где этот док лежал.) Никаких окончаний , коэфф. релевантности слов и предложений не надо (это по поводу мини яндекса *)) Блин мне уже кажется, что легче сделать это самому 8). Жаль времени мало.... Еще вопросы? По-прежнему жду предложений о цене или вопросв (мона в личку). |
|
15.08.2007, 23:11 | #12 |
просто Гений
Сообщений: 3,145
Регистрация: 22.01.2007
Возраст: 49
Не в сети |
Рассмотри решение от фирмы 1с
Называеться "1с-архив". Полностью удовлетворяте Твоим условиям+куча бонусов. Знаком не по наслышке, имею опыт в установке и настройке. Стоит от 400$ версия 2.1 и от 900$ до 3000$ версия 3,0 (последняя цифирь в 3000$ может быть завышена, давно не смотрел у них на сайте.) |
21.08.2007, 15:30 | #17 | |
Форумец
Сообщений: 743
Регистрация: 28.01.2005
Возраст: 42
Не в сети |
Цитата:
ИМХО: ТЗ ужастнее не придумать! Всегда удивлялся тому, как институтские преподы могут извратить задачку, чтобы никто не догадался что тама задано.... Это наверно от того, что сами никуя не програмили комерческих приложений... :-/ |
|
21.08.2007, 17:15 | #18 | |
Форумец
Сообщений: 2,376
Регистрация: 14.02.2004
Не в сети |
Цитата:
http://www.uinc.ru/articles/39/ статья старовата, надеюсь сам разберешься |
|
22.08.2007, 08:16 | #19 |
Форумец
Сообщений: 743
Регистрация: 28.01.2005
Возраст: 42
Не в сети |
shuri, поздравляю! ты балбес!
http://ru.wikipedia.org/wiki/%D0%A2%...B0%D0%B9%D0%BB http://ru.wikipedia.org/wiki/%D0%94%...B0%D0%B9%D0%BB Учимся отличать текстовые файлы от двоичных! |