vectorize sequence for init, derive vectorized state

joelpaulkoch · joelpaulkoch · commit 41dd2ad4dc4c · 2025-11-07T14:04:40.000+01:00
diff --git a/lib/bumblebee/text/generation.ex b/lib/bumblebee/text/generation.ex
@@ -592,7 +592,7 @@ defmodule Bumblebee.Text.Generation do
     finished_length = Nx.select(padded_batch_item?, 1, 0)
 
     context = %{
-      sequences: sequences,
+      sequence: Nx.vectorize(sequences, :batch),
       input_length: length,
       length: length
     }
diff --git a/test/bumblebee/text/generation_test.exs b/test/bumblebee/text/generation_test.exs
@@ -233,10 +233,10 @@ defmodule Bumblebee.Text.GenerationTest do
 
     @impl Bumblebee.LogitsProcessor
     def init(logits_processor, context) do
-      batch_size = Nx.axis_size(context.sequences, 0)
+      initial_enforced_token_id = Nx.tensor([logits_processor.initial_enforced_token_id])
 
-      initial_enforced_batch_token_id =
-        Nx.broadcast(logits_processor.initial_enforced_token_id, {batch_size, 1})
+      [initial_enforced_batch_token_id, _sequence] =
+        Nx.broadcast_vectors([initial_enforced_token_id, context.sequence])
 
       %{
         next_enforced_token_id: initial_enforced_batch_token_id
@@ -245,13 +245,11 @@ defmodule Bumblebee.Text.GenerationTest do
 
     @impl Bumblebee.LogitsProcessor
     def process(_logits_processor, state, logits, _context) do
-      next_enforced_token_id = Nx.vectorize(state.next_enforced_token_id, :batch)
+      next_enforced_token_id = state.next_enforced_token_id
 
       logits = enforce_token(logits, next_enforced_token_id)
 
-      next_enforced_token_id =
-        Nx.add(next_enforced_token_id, 1)
-        |> Nx.devectorize(keep_names: false)
+      next_enforced_token_id = Nx.add(next_enforced_token_id, 1)
 
       state = put_in(state.next_enforced_token_id, next_enforced_token_id)
 

Original file line number	Diff line number	Diff line change
`@@ -592,7 +592,7 @@ defmodule Bumblebee.Text.Generation do`
`592`	`592`	`finished_length = Nx.select(padded_batch_item?, 1, 0)`
`593`	`593`
`594`	`594`	`context = %{`
`595`		`- sequences: sequences,`
	`595`	`+ sequence: Nx.vectorize(sequences, :batch),`
`596`	`596`	`input_length: length,`
`597`	`597`	`length: length`
`598`	`598`	`}`