tabby

Commit Graph

Author	SHA1	Message	Date
Meng Zhang	486e507079	fix: correct Decoding behavior in incremental manner (#491 ) * feat: implement IncrementalDecoding * refactor: use IncrementalDecoding for ctranslate2 * refactor: rename StopWords to DecodingFactory * refactor: move decoding logic to tabby-inference * feat: optimize decoding range * cleanup	2023-09-29 13:06:47 +00:00
Meng Zhang	44f013f26e	feat: add /generate and /generate_streaming (#482 ) * feat: add generate_stream interface * extract engine::create_engine * feat add generate::generate * support streaming in llama.cpp * support streaming in ctranslate2 * update * fix formatting * refactor: extract helpers functions	2023-09-28 17:20:50 +00:00
Meng Zhang	d42942c379	feat: support ModelScope for model registry downloading (#477 ) * feat: update cache info file after each file got downloaded * refactor: extract Downloader for model downloading logic * refactor: extract HuggingFaceRegistry * refactor: extract serde_json to workspace dependency * feat: add ModelScopeRegistry * refactor: extract registry to its sub dir. * feat: add scripts to mirror hf model to modelscope	2023-09-26 11:52:11 -07:00
Meng Zhang	1ccf9b2323	refactor: run make fix	2023-09-11 12:58:38 +08:00
Meng Zhang	17397c8c8c	feat: add http api bindings (#410 ) * feat: add http-api-bindings * feat: add http-api-bindings * hand max_input_length * rename * update * update * add examples/simple.rs * update * add default value for stop words * update * fix lint * update	2023-09-09 03:59:42 +00:00
Meng Zhang	3573d4378e	feat: llama.cpp for metal support [TAB-146] (#391 ) * feat: init commit adding llama-cpp-bindings * add llama.cpp submodule * add LlamaEngine to hold llama context / llama model * add cxxbridge * add basic greedy sampling * move files * make compile success * connect TextGeneration with LlamaEngine * experimental support llama.cpp * add metal device * add Accelerate * fix namespace for llama-cpp-bindings * fix lint * move stepping logic to rust * add stop words package * use stop-words in ctranslate2-bindings * use raw string for regex * use Arc<Tokenizer> for sharing tokenizers * refactor: remove useless stop_words_encoding_offset * switch to tokenizers 0.13.4-rc.3 * fix lints in cpp * simplify implementation of greedy decoding * feat: split metal feature for llama backend * add ci * update ci * build tabby bin in ci build	2023-09-03 09:59:07 +08:00
Meng Zhang	d0f6ad2d2a	feat: add anonymous usage tracker (#342 ) * feat: add anonymous usage tracker * improve deps * update * update	2023-08-09 07:31:13 +00:00
Meng Zhang	b8308b7118	refactor: extract TextGeneration trait (#324 ) * add tabby-inference * extract TextGeneration trait * format * Rename TextInferenceEngine to CTranslate2Engine	2023-08-02 06:12:51 +00:00
Meng Zhang	4388fd0050	feat: support prompt rewriting (#295 ) * refactor: extract PromptBuilder * feat: load tantivy index in prompt builder * integrate with searcher * add enable_prompt_rewrite to control rewrite behavior * nit docs * limit 1 snippet per identifier * extract magic numbers	2023-07-13 09:05:41 +00:00
Meng Zhang	fcbc5edc55	Revert "feat: add /experimental/search endpoint (#258 )" (#260 ) This reverts commit `04980160e5`.	2023-06-22 14:23:35 -07:00
Meng Zhang	04980160e5	feat: add /experimental/search endpoint (#258 ) * feat: add /experimental/search endpoint * fix format	2023-06-22 20:47:32 +00:00
Meng Zhang	7ed5dd584d	feat: experiment ctags support in scheduler (#207 ) * experiment ctags support * add document.rs * extract Document to common * integrate tags into dataset builder * skip if none * do not add scheduler in client binary * fix fmt	2023-06-21 19:48:13 -07:00
Meng Zhang	249d51d0f5	feat: add indexer [TAB-17] (#199 ) * add basic indexer * formatting	2023-06-05 22:18:10 +00:00
Meng Zhang	e8a33312bb	refactor: extract download into tabby-download (#195 ) * refactor: extract download into tabby-download * remove unused deps	2023-06-05 18:40:24 +00:00
Meng Zhang	e8b1c10738	feat: add `tabby scheduler` command (#194 ) * feat: add `tabby scheduler` command * update test cases * fix fmt	2023-06-05 18:29:38 +00:00
Meng Zhang	da02d471a9	chore: add tabby-scheduler [TAB-17] (#192 ) * add scheduler * update fmt * add integration tests for scheduler	2023-06-05 03:08:43 +00:00
Meng Zhang	2bf5bcd0cf	refactor: extract TextInferenceEngineImpl to reduce duplications between EncoderDecoderImpl and DecoderImpl #189	2023-06-04 22:28:39 +00:00
Meng Zhang	6de61f45bb	chore: mark thread safety [TAB-52] (#186 ) * mark thread safety * use shared_ptr to ensure thread safety * fmt	2023-06-04 06:23:31 +00:00
Meng Zhang	f3b37b253b	feat: add events logger (#170 ) * add common events * log events in serve * formatting * extract serde_conv * update * update * fix logging * update	2023-05-30 15:44:29 -07:00
Meng Zhang	d8cee4adac	chore: extract tabby-common (#169 ) * chore: extract tabby-common * simplify	2023-05-29 23:39:02 -07:00
Meng Zhang	734957d1de	build mac binary in ci (#152 ) * build mac binary in ci * update * update * turn on verbose * fix cross compile * update * update * update * update * update * update * update	2023-05-27 14:31:27 -07:00

21 Commits (63612d5a676c205c20175efb034352e2b8b65597)