Старый 14.08.2007, 17:32   #1   
Vulture[BUG]
 
Аватар для Strucka
 
Сообщений: 899
Регистрация: 21.05.2005
Возраст: 37

Strucka вне форума Не в сети
Задание за деньги.

Готов выслушать ваши прделожения по стоимости исполнения следующего проекта:
Приложение должно обеспечивать:
1.Хранение информации о примерах текстовых документов.
2.Просмотр и модификацию содержимого базы данных примеров текстовых документов.
3.Построение функции определения степени «ключевизны» слова.
4.Выделение ключевых слов произвольного документа.
5.Хранение, просмотр и редактирование древовидного рубрикатора, позволяющего организовать каталоги и подкаталоги документов.
6.Хранение ключевых слов для каждой рубрики.
Кратко смысл таков: есть документ, мы находим в нем ключевые слова, просматриваем ключевые слова по рубрикам (некоторое начальное количество рубрик задает пользователь), при достаточном совпадении кидаем документ в эту рубрику.
Для данного проекта есть описание и анализ задачи. Необходимо собственно реализация c построением базы в interbase или mysql ну и тд...
Я еще не решил отадм проект или сделаю сам, так что пока просчитываю варианты.
Слушаю ваши предложения цены (можно в приват)

одно маленькое но, Delphi называется. Планируется реализация в дельфях. Но все возможно, я благодарен всем кто откликнулся, буду думать
  Ответить с цитированием
Старый 14.08.2007, 17:44   #2   
хЕрург
 
Аватар для doXtor
 
Сообщений: 3,857
Регистрация: 05.02.2006
Возраст: 43

doXtor вне форума Не в сети
напиши чуть развернутее, языком по-русски..... а то смысл того, чо в итоге должно происходить - не прослеживается
  Ответить с цитированием
Старый 14.08.2007, 19:52   #3   
Форумец
 
Аватар для MR_Romik
 
Сообщений: 370
Регистрация: 08.02.2007
Возраст: 39

MR_Romik вне форума Не в сети
Поддерживаю doXtor,
  Ответить с цитированием
Старый 14.08.2007, 22:37   #4   
Vulture[BUG]
 
Аватар для Strucka
 
Сообщений: 899
Регистрация: 21.05.2005
Возраст: 37

Strucka вне форума Не в сети
Смысл написать прогу, которая обрабатывала бы документы текстовые , выделяла из них ключевые слова по определенным правилам(пока основа - частотный словарь с исключением символов, которые не могут являться ключевыми словами (точки, символы + = и тд...) и заносила документы по рубрикам (опять же по некоторому алгоритму зависящему от ключевых слов (некоего коэффициента) и того же коэффициента ключевых слов документов находящихся уже в рубрике).
Начальные данные, на основе которых будет происходить занесение по рубрикам (что-то вроде шаблона) заполняется экспертом (программистом 8)).
+ База в интербейзе (желательно)
Еще вопросы?
  Ответить с цитированием
Старый 15.08.2007, 01:27   #5   
хЕрург
 
Аватар для doXtor
 
Сообщений: 3,857
Регистрация: 05.02.2006
Возраст: 43

doXtor вне форума Не в сети
Strucka, я походу дебил..... никуя не понял понял тока что есть куча текстовых документов (т.е. в тхт формате) из них нужно выбирать из них какие-то слова, которые уже есть в какомто словаре без каких-то символов, затем по какомуто правилу распределять эти доки по каталогам. Причем словарь здесь - не понятно.... что такое частотный словарь - совсем не понятно.
Цитата:
Сообщение от Strucka
по некоторому алгоритму зависящему от ключевых слов (некоего коэффициента) и того же коэффициента ключевых слов документов находящихся уже в рубрике
вот эту фразу вообще раз 8 читал и никуя ни въехал.....

Strucka, без обид, ты сам-то четко понимаешь чо сделать нада?

MR_Romik, ты чонить понял?

Цитата:
Сообщение от Strucka
Еще вопросы?
походу все. какие тут могут быть вопросы....... под чем базу писать - мне нацрать, хоть под иб, хоть под парадоксом, хоть под SQL хоть под чем, вопрос в том, что всетаки должно в ней происходить, а я видимо из-за своей тупости въехать в это совсем нимагу
  Ответить с цитированием
Старый 15.08.2007, 07:57   #6   
///
 
Аватар для -=Женек=-
 
Сообщений: 9,724
Регистрация: 02.04.2005
Возраст: 43

-=Женек=- вне форума Не в сети
doXtor,

неужели непонятно, еще один человек захотел сделать "свой яндекс" и грести бабло до конца жизни. Но как всегда, хочется, чтобы напрягся кто-то другой. Когда речь зайдет о цене он будет удивленно спрашивать "а почему так дорого?". Зайди на freelance.ru там таких пруд пруди.

Если я ошибаюсь, мои извинения форумцу Strucka
  Ответить с цитированием
Старый 15.08.2007, 08:26   #7   
Форумец
 
Аватар для MR_Romik
 
Сообщений: 370
Регистрация: 08.02.2007
Возраст: 39

MR_Romik вне форума Не в сети
doXtor, НЕ только ты дебил, я неверное тоже дебил! -=Женек=-, Если это то..., то смысл это творить на дельфях и в интербезе?
Помоему просто смахивает на задание из института(там практика или еще что то), я прав
  Ответить с цитированием
Старый 15.08.2007, 08:41   #8   
///
 
Аватар для -=Женек=-
 
Сообщений: 9,724
Регистрация: 02.04.2005
Возраст: 43

-=Женек=- вне форума Не в сети
MR_Romik, а что, обязательно скриптованый язык надо использовать? Я одно время для локалки делал поисковую систему ( так и не доделал ((( ) - так я в C++ Builder делал и мне это казалось более рациональным.
  Ответить с цитированием
Старый 15.08.2007, 08:41   #9   
///
 
Аватар для -=Женек=-
 
Сообщений: 9,724
Регистрация: 02.04.2005
Возраст: 43

-=Женек=- вне форума Не в сети
Цитата:
Помоему просто смахивает на задание из института
тож вариант.
  Ответить с цитированием
Старый 15.08.2007, 18:05   #10   
Vulture[BUG]
 
Аватар для Strucka
 
Сообщений: 899
Регистрация: 21.05.2005
Возраст: 37

Strucka вне форума Не в сети
Цитата:
Сообщение от MR_Romik
Помоему просто смахивает на задание из института(там практика или еще что то), я прав
Совершенно верно. 8) Именно из института 8)
Под декстовыми документами понималось не документы с расширением ткст, а документы , которые могут содержать текст (там вордовские файлы итд).
Что должна делать прога:
1.Обрабатывать документ и выделять ключевые слова по след принципу: создать частотный словарь (посчитать количество слов). При этом из выборки должны быть исключены некоторые "слова" (типа ы а ц у к ( ) * & # . < / ) ,а затем полученные данные разделить на кол-во слов в документе (общее кол-во) (пока такой способ).
2. Вычислять коэфф. ключевизны слова (об этом подробнее могу выслать файло, потому как долго объяснять)
3. ПО вычислениям в 1. и 2. оперделять документ в рубрику по принципу:
а)сначала вручную создается рубрика и в нее записывается выбранный экспертом документ, и для него программно определяется 1. и 2.; а для рубрики зааются вручную ключевые слова по которым в нее определять документы (ну и считаются 1. и 2. для выброанного списка таких слов по всем документам , которые находятся в рубрике).
б)новый документ после 1. и 2. проходит сравнение своим списком ключевых слов с таким списком у рубрик, и заносится в соответствующую.
4. Если юзер хочет новую рубрику, то он должен задать для нее начальные параметры (см.3.а)
5. Ну и юзерь естесно может осуществить поиск(по рубрикам, или задав набор слов ему в качестве рез-та список доков , которые могли бы его заинтересовать, ну и рубрика где этот док лежал.)
Никаких окончаний , коэфф. релевантности слов и предложений не надо (это по поводу мини яндекса *))
Блин мне уже кажется, что легче сделать это самому 8). Жаль времени мало....
Еще вопросы? По-прежнему жду предложений о цене или вопросв (мона в личку).
  Ответить с цитированием
Старый 15.08.2007, 23:01   #11   
Форумец
 
Аватар для MR_Romik
 
Сообщений: 370
Регистрация: 08.02.2007
Возраст: 39

MR_Romik вне форума Не в сети
А у тебя пункт 3 два раза повторяеться)))
Если честно я еще сильнее запутался)))))) )))
В каком Вузе это задают?

Я б еще научил бы ставить корректно ТЗ!
  Ответить с цитированием
Старый 15.08.2007, 23:11   #12   
просто Гений
 
Сообщений: 3,145
Регистрация: 22.01.2007
Возраст: 49

RDS вне форума Не в сети
Рассмотри решение от фирмы 1с
Называеться "1с-архив". Полностью удовлетворяте Твоим условиям+куча бонусов. Знаком не по наслышке, имею опыт в установке и настройке.
Стоит от 400$ версия 2.1 и от 900$ до 3000$ версия 3,0 (последняя цифирь в 3000$ может быть завышена, давно не смотрел у них на сайте.)
  Ответить с цитированием
Старый 16.08.2007, 08:46   #13   
Форумец
 
Аватар для MR_Romik
 
Сообщений: 370
Регистрация: 08.02.2007
Возраст: 39

MR_Romik вне форума Не в сети
RDS,
Я прям ору, человеку это задали в институте, ща прям он возьмет и заплатит 400-900 баков, тогда уж сразу проще всю ссесию купить!))))
  Ответить с цитированием
Старый 16.08.2007, 11:13   #14   
///
 
Аватар для -=Женек=-
 
Сообщений: 9,724
Регистрация: 02.04.2005
Возраст: 43

-=Женек=- вне форума Не в сети
Цитата:
человеку это задали в институте, ща прям он возьмет и заплатит 400-900 баков
... а препод скажет - нас не наёбёшь, ты сп...дил это у 1С )))))
  Ответить с цитированием
Старый 16.08.2007, 20:26   #15   
Vulture[BUG]
 
Аватар для Strucka
 
Сообщений: 899
Регистрация: 21.05.2005
Возраст: 37

Strucka вне форума Не в сети
я сам в 1с программирую 8)
  Ответить с цитированием
Старый 21.08.2007, 08:16   #16   
Форумец
 
Аватар для MR_Romik
 
Сообщений: 370
Регистрация: 08.02.2007
Возраст: 39

MR_Romik вне форума Не в сети
Цитата:
Сообщение от Strucka
я сам в 1с программирую 8)
Почет тебе и хвала!
Тогда в чем проблема то?
  Ответить с цитированием
Старый 21.08.2007, 15:30   #17   
Форумец
 
Аватар для Ant0
 
Сообщений: 743
Регистрация: 28.01.2005
Возраст: 42

Ant0 вне форума Не в сети
Цитата:
Сообщение от Strucka
а документы , которые могут содержать текст (там вордовские файлы итд).
покажите мне тупому, в каком месте в вордовском файле содержится текст?! 8-O

ИМХО:
ТЗ ужастнее не придумать! Всегда удивлялся тому, как институтские преподы могут извратить задачку, чтобы никто не догадался что тама задано.... Это наверно от того, что сами никуя не програмили комерческих приложений... :-/
  Ответить с цитированием
Старый 21.08.2007, 17:15   #18   
Форумец
 
Аватар для shuri
 
Сообщений: 2,376
Регистрация: 14.02.2004

shuri вне форума Не в сети
Цитата:
Сообщение от Ant0
покажите мне тупому, в каком месте в вордовском файле содержится текст?! 8-O
http://vx.netlux.org/lib/akk02.html#p4
http://www.uinc.ru/articles/39/
статья старовата, надеюсь сам разберешься
  Ответить с цитированием
Старый 22.08.2007, 08:16   #19   
Форумец
 
Аватар для Ant0
 
Сообщений: 743
Регистрация: 28.01.2005
Возраст: 42

Ant0 вне форума Не в сети
shuri, поздравляю! ты балбес!
http://ru.wikipedia.org/wiki/%D0%A2%...B0%D0%B9%D0%BB
http://ru.wikipedia.org/wiki/%D0%94%...B0%D0%B9%D0%BB

Учимся отличать текстовые файлы от двоичных!
  Ответить с цитированием
Поиск в теме: 



Быстрый переход:

  Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения
BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot
Support by DrIQ & Netwind