update format

2023-04-07 23:20:20 +08:00 · 2023-04-07 23:20:20 +08:00 · c67d365db3
commit c67d365db3
parent f4ba4b6ff2
3 changed files with 15 additions and 124 deletions
--- a/chat_server.py
+++ b/chat_server.py
@ -32,13 +32,15 @@ raw_model = LlamaForCausalLM(
    )
 )
 ckpt = torch.load(
-    "data/saved_ckpt/instruction_tuning_math_code_multiturn/36001.pt", map_location="cpu"
+    "data/saved_ckpt/instruction_tuning_math_code_multiturn/36001.pt",
    map_location="cpu",
 )
 raw_model.load_state_dict(ckpt)
 raw_model.eval()
 model = raw_model.cuda()
 print("ready")
 def parse_codeblock(text):
    lines = text.split("\n")
    for i, line in enumerate(lines):
@ -46,12 +48,13 @@ def parse_codeblock(text):
            if line != "```":
                lines[i] = f'<pre><code class="{lines[i][3:]}">'
            else:
-                lines[i] = '</code></pre>'
+                lines[i] = "</code></pre>"
        else:
            if i > 0:
                lines[i] = "<br/>" + line.replace("<", "&lt;").replace(">", "&gt;")
    return "".join(lines)
 with gr.Blocks() as demo:
    gr.Markdown(
        """
@ -75,15 +78,17 @@ with gr.Blocks() as demo:
        for prompt, completion in history:
            round += 1
            if completion is None:
-                inputs = 'user:{}\nsystem:'.format(prompt)
+                inputs = "user:{}\nsystem:".format(prompt)
-                inputs = tokenizer(inputs, return_tensors=True, add_special_tokens=False)
+                inputs = tokenizer(
-                context.append(inputs['input_ids'])
+                    inputs, return_tensors=True, add_special_tokens=False
                )
                context.append(inputs["input_ids"])
            else:
-                inputs = 'user:{}\nsystem:{}'.format(prompt, completion)
+                inputs = "user:{}\nsystem:{}".format(prompt, completion)
                inputs = tokenizer(inputs, return_tensors=True, add_special_tokens=True)
-                context.append(inputs['input_ids'])
+                context.append(inputs["input_ids"])
        context = torch.cat(context, dim=-1)
-        context = context[:, -1024: ]
+        context = context[:, -1024:]
        inputs_len = context.shape[1]
        context = context.cuda()
        pred = model.generate(input_ids=context, max_new_tokens=512, do_sample=True)
@ -99,7 +104,7 @@ with gr.Blocks() as demo:
    )
    clear.click(lambda: None, None, chatbot, queue=False)
    gr.Markdown(
-    """
+        """
    当前体验服务生成的所有内容都是由人工智能模型生成，我们对其生成内容的准确性、完整性和功能性不做任何保证，并且其生成的内容不代表我们的态度或观点。
    联系方式: sl12160010@gmail.com  对于该项目有任何意见和建议都欢迎联系我.
--- a/dataset/tokenizer.py
+++ b/dataset/tokenizer.py
@ -169,7 +169,7 @@ class Tokenizer:
                            flag = True
                            break
            if flag:
-                ids = ids[: j]
+                ids = ids[:j]
            else:
                ids = ids
            out.append(ids)
--- a/speed_test.py
+++ b/speed_test.py
@ -1,114 +0,0 @@
 # import time
 # import torch
 # from colossalai.nn.optimizer import HybridAdam
 # from deepspeed.ops.adam import FusedAdam
 # from transformers import LlamaForCausalLM, LlamaConfig
 # import lightning.pytorch as pl
 # # define the LightningModule
 # class LitAutoEncoder(pl.LightningModule):
 #     def __init__(self):
 #         super().__init__()
 #     def training_step(self, inputs, batch_idx):
 #         # training_step defines the train loop.
 #         # it is independent of forward
 #         # print(inputs.shape)
 #         out = self.model(input_ids=inputs, labels=inputs)
 #         loss = out.loss
 #         return loss
 #     def configure_optimizers(self):
 #         optimizer = HybridAdam(self.parameters(), lr=1e-5)
 #         return optimizer
 #     def configure_sharded_model(self):
 #         self.model = LlamaForCausalLM(
 #             LlamaConfig(
 #                 vocab_size=32000,
 #                 initializer_range=0.001,
 #                 pad_token_id=0,
 #                 rms_norm_eps=1e-5,
 #                 hidden_dropout_prob=0.1,
 #                 attention_dropout_prob=0.1,
 #                 use_stable_embedding=False,
 #                 shared_input_output_embedding=False,
 #             )
 #         )
 # # init the autoencoder
 # autoencoder = LitAutoEncoder()
 # trainer = pl.Trainer(limit_train_batches=500, max_epochs=1, accelerator='gpu', devices=8, strategy="colossalai", precision=16)
 # class FakeSet(torch.utils.data.Dataset):
 #     def __getitem__(self, idx):
 #         return torch.randint(0, 32000, (2048, ))
 #     def __len__(self):
 #         return 10000
 # train_loader = torch.utils.data.DataLoader(FakeSet(), batch_size=1)
 # trainer.fit(model=autoencoder, train_dataloaders=train_loader)
 # import time
 # import torch
 # from accelerate import Accelerator
 # from deepspeed.ops.adam import FusedAdam
 # from transformers import LlamaForCausalLM, LlamaConfig
 # accelerator = Accelerator()
 # raw_model = LlamaForCausalLM(
 #     LlamaConfig(
 #         vocab_size=32000,
 #         initializer_range=0.001,
 #         pad_token_id=0,
 #         rms_norm_eps=1e-5,
 #         hidden_dropout_prob=0.1,
 #         attention_dropout_prob=0.1,
 #         use_stable_embedding=False,
 #         shared_input_output_embedding=False,
 #     )
 # )
 # optimizer = FusedAdam(raw_model.parameters(), lr=1e-5)
 # import random
 # import sentencepiece as spm
 # from dataset.tokenizer import Tokenizer
 # from dataset.data_iter import create_shard_kwargs, DataIter
 # from torch.utils.data import DataLoader
 # max_length = 2048
 # tokenizer_model_path = 'configs/10w_vocab_wudao5_pile10.model'
 # sp_model = spm.SentencePieceProcessor(model_file=tokenizer_model_path)
 # tokenizer = Tokenizer(sp_model)
 # paths = create_shard_kwargs(['1*'])
 # random.shuffle(paths)
 # data_set = DataIter(
 #     paths
 # )
 # train_loader = DataLoader(
 #     data_set,
 #     batch_size=1
 # )
 # model, optimizer, train_loader = accelerator.prepare(raw_model, optimizer, train_loader)
 # inputs = torch.randint(0, 32000, (1, 2048), device=accelerator.device)
 # for i in range(10):
 #     optimizer.zero_grad()
 #     out = model(input_ids=inputs, labels=inputs)
 #     loss = out.loss
 #     accelerator.backward(loss)
 #     optimizer.step()
 # start_time = time.time()
 # for i in range(500):
 #     optimizer.zero_grad()
 #     out = model(input_ids=inputs, labels=inputs)
 #     loss = out.loss
 #     accelerator.backward(loss)
 #     optimizer.step()
 # end_time = time.time()
 # accelerator.print(end_time - start_time)